使用PHP将Wiktionary XML数据转储到MySQL数据库中

詹森·约翰

好的,我只是想解析Wikimedia提供的Wiktionary Data Dump

我的意图是解析XML数据转储到MySQL数据库中。我没有找到有关此XML结构的适当文档。另外,我无法打开该文件,因为它实际上非常大(〜1 GB)。

我曾想过使用一些PHP脚本来解析它,但是我对要进行的XML结构一无所知。因此,如果有人已经使用PHP解析了MySQL(或对解析任何工具有想法),请分享详细信息。如果PHP中没有任何内容,则其他方法也可以。

我只是关注了这篇文章(http://www.igrec.ca/lexicography/installing-a-local-copy-of-wiktionary-mysql/),但是它没有成功.. :(如果有人在此方面取得了成功过程中,请提供帮助。

哈克雷

可以在PHP中通过对流进行XMLReader操作来解析这些文件您拥有的文件的结构是示例性的(查看大约前3000个元素):compress.bzip2://

\-mediawiki (1)
  |-siteinfo (1)
  | |-sitename (1)
  | |-base (1)
  | |-generator (1)
  | |-case (1)
  | \-namespaces (1)
  |   \-namespace (40)
  \-page (196)
    |-title (196)
    |-ns (196)
    |-id (196)
    |-restrictions (2)
    |-revision (196)
    | |-id (196)
    | |-parentid (194)
    | |-timestamp (196)
    | |-contributor (196)
    | | |-username (182)
    | | |-id (182)
    | | \-ip (14)
    | |-comment (183)
    | |-text (195)
    | |-sha1 (195)
    | |-model (195)
    | |-format (195)
    | \-minor (99)
    \-redirect (5)

该文件本身稍大,因此需要花费很多时间来处理。或者,不对XML转储进行操作,而仅通过mysql命令行工具导入SQL转储该站点上也提供SQL转储,请参见英语Wiktionary的所有转储格式


总体文件较小,包含66 849 000个元素:

\-mediawiki (1)
  |-siteinfo (1)
  | |-sitename (1)
  | |-base (1)
  | |-generator (1)
  | |-case (1)
  | \-namespaces (1)
  |   \-namespace (40)
  \-page (3993913)
    |-title (3993913)
    |-ns (3993913)
    |-id (3993913)
    |-restrictions (552)
    |-revision (3993913)
    | |-id (3993913)
    | |-parentid (3572237)
    | |-timestamp (3993913)
    | |-contributor (3993913)
    | | |-username (3982087)
    | | |-id (3982087)
    | | \-ip (11824)
    | |-comment (3917241)
    | |-text (3993913)
    | |-sha1 (3993913)
    | |-model (3993913)
    | |-format (3993913)
    | \-minor (3384811)
    |-redirect (27340)
    \-DiscussionThreading (4698)
      |-ThreadSubject (4698)
      |-ThreadPage (4698)
      |-ThreadID (4698)
      |-ThreadAuthor (4698)
      |-ThreadEditStatus (4698)
      |-ThreadType (4698)
      |-ThreadSignature (4698)
      |-ThreadParent (3605)
      |-ThreadAncestor (3605)
      \-ThreadSummaryPage (11)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将MySQL转储文件还原到数据库中

来自分类Dev

PhpStorm可以将MySQL数据库转储到sql文件吗?

来自分类Dev

PhpStorm可以将MySQL数据库转储到sql文件吗?

来自分类Dev

将mysql转储文本文件还原到数据库

来自分类Dev

将表作为bash脚本中的选项进行转储以转储postgresql数据库

来自分类Dev

将数据库转储加载到postgres数据库中

来自分类Dev

将数据库转储加载到postgres数据库中

来自分类Dev

如何使用mysql将一个数据库转储到另一个数据库?

来自分类Dev

使用Marshal将Sqlite内存数据库转储到磁盘

来自分类Dev

将基于postgis1.5的转储导入到postgis2.0数据库中

来自分类Dev

使用boot2docker将heroku postgres数据库转储导入到docker数据库容器中

来自分类Dev

将Redis转储还原到其他数据库

来自分类Dev

使用python将xml数据转储到csv文件中的单元格中

来自分类Dev

如何将MySQL转储导入SQL Server数据库

来自分类Dev

如何将转储文件Oracle数据库导入MySQL

来自分类Dev

如何将MySQL转储导入SQL Server数据库

来自分类Dev

将postgres数据库转储导入本地应用

来自分类Dev

我可以使用mysql(不是mysqldump)转储数据库吗?

来自分类Dev

如何使用命令行转储Mysql数据库?

来自分类Dev

如何将Oracle中的数据库架构导出到转储文件

来自分类Dev

将转储/ SQL文件导入到我在Linode上的PostgreSQL数据库中

来自分类Dev

将转储文件加载到Redis数据库中的问题

来自分类Dev

将转储/ SQL文件导入到我的Linode上的PostgreSQL数据库中

来自分类Dev

将转储文件加载到Redis数据库中的问题

来自分类Dev

从PHP + PostgreSql中的sql文件运行数据库转储(还原)

来自分类Dev

如何使用sqlalchemy获取在sqlite中创建的数据库的sql转储

来自分类Dev

如何使用卷从Docker中的转储或SQL文件还原数据库?

来自分类Dev

os / exec将mysql数据转储到文件

来自分类Dev

使用php将POST数据转储为XML

Related 相关文章

  1. 1

    将MySQL转储文件还原到数据库中

  2. 2

    PhpStorm可以将MySQL数据库转储到sql文件吗?

  3. 3

    PhpStorm可以将MySQL数据库转储到sql文件吗?

  4. 4

    将mysql转储文本文件还原到数据库

  5. 5

    将表作为bash脚本中的选项进行转储以转储postgresql数据库

  6. 6

    将数据库转储加载到postgres数据库中

  7. 7

    将数据库转储加载到postgres数据库中

  8. 8

    如何使用mysql将一个数据库转储到另一个数据库?

  9. 9

    使用Marshal将Sqlite内存数据库转储到磁盘

  10. 10

    将基于postgis1.5的转储导入到postgis2.0数据库中

  11. 11

    使用boot2docker将heroku postgres数据库转储导入到docker数据库容器中

  12. 12

    将Redis转储还原到其他数据库

  13. 13

    使用python将xml数据转储到csv文件中的单元格中

  14. 14

    如何将MySQL转储导入SQL Server数据库

  15. 15

    如何将转储文件Oracle数据库导入MySQL

  16. 16

    如何将MySQL转储导入SQL Server数据库

  17. 17

    将postgres数据库转储导入本地应用

  18. 18

    我可以使用mysql(不是mysqldump)转储数据库吗?

  19. 19

    如何使用命令行转储Mysql数据库?

  20. 20

    如何将Oracle中的数据库架构导出到转储文件

  21. 21

    将转储/ SQL文件导入到我在Linode上的PostgreSQL数据库中

  22. 22

    将转储文件加载到Redis数据库中的问题

  23. 23

    将转储/ SQL文件导入到我的Linode上的PostgreSQL数据库中

  24. 24

    将转储文件加载到Redis数据库中的问题

  25. 25

    从PHP + PostgreSql中的sql文件运行数据库转储(还原)

  26. 26

    如何使用sqlalchemy获取在sqlite中创建的数据库的sql转储

  27. 27

    如何使用卷从Docker中的转储或SQL文件还原数据库?

  28. 28

    os / exec将mysql数据转储到文件

  29. 29

    使用php将POST数据转储为XML

热门标签

归档