OSXでWikipediaのデータをSQLServerに取り込む。
取り込んでみた。
こちらを参考に。
http://d.hatena.ne.jp/dkfj/20070902/1188730207
- XMLからテキストのパース中にエラーが発生。
xml2sql: parsing aborted at line 652 pos 16.
http://read2ch.com/r/php/1183501450/
943:nobodyさん[sage] 09/09/25(金) 12:04:14 ID:???
# bzcat jawiki-latest-pages-articles.xml.bz2 | sed -e 's// <\/redirect>/' | xml2sql
unexpected element
xml2sql: parsing aborted at line 652 pos 14.
# bzcat jawiki-latest-pages-articles.xml.bz2 | sed -e 's///' | xml2sql
# ls -l *.txt
-rw-r--r-- 1 root root 105800217 9月 25 11:57 page.txt
-rw-r--r-- 1 root root 144668738 9月 25 11:57 revision.txt
-rw-r--r-- 1 root root 3805082298 9月 25 11:57 text.txtこうなった。
こちらを参考に成功!