UNLIMITED JAVA

WEB技術や普段の生活のブログ

OSXでWikipediaのデータをSQLServerに取り込む。

取り込んでみた。

こちらを参考に。
http://d.hatena.ne.jp/dkfj/20070902/1188730207

  • XMLからテキストのパース中にエラーが発生。

xml2sql: parsing aborted at line 652 pos 16.

http://read2ch.com/r/php/1183501450/

943:nobodyさん[sage] 09/09/25(金) 12:04:14 ID:???
# bzcat jawiki-latest-pages-articles.xml.bz2 | sed -e 's//<\/redirect>/' | xml2sql
unexpected element
xml2sql: parsing aborted at line 652 pos 14.
# bzcat jawiki-latest-pages-articles.xml.bz2 | sed -e 's///' | xml2sql
# ls -l *.txt
-rw-r--r-- 1 root root 105800217 9月 25 11:57 page.txt
-rw-r--r-- 1 root root 144668738 9月 25 11:57 revision.txt
-rw-r--r-- 1 root root 3805082298 9月 25 11:57 text.txt

こうなった。

こちらを参考に成功!