Kazuhiro's blog
ようこそ! Kazuhiro's blog
火曜日, 3月 19 2024 @ 08:52 午後 JST
   

wikipedia-fpwを公開

general

前回紹介したウィキペディア日本語版のダンプデータからJIS X 4081な書籍を作るツールの続きです。取り敢えず相互参照できるようになったので公開しました

まだまだ整形がおかしかったり、実体参照やそのままでは収録できない文字の変換テーブルも全然作っていないのですが、いつまでたっても終わらない気がしたので気がついたら修正していくことにします。

正直なところ、Perlを知らない人間が動けばよしで書いたコードです。 変換テーブルの追加や修正、ツール自体の修正等ありましたらお気軽にどうぞ。

タグ:Wikipedia FreePWING EPWING

トラックバック

このエントリのトラックバックURL: http://ikazuhiro.s206.xrea.com/trackback.php/20070620221214466

wikipedia-fpwを公開 | 4 件のコメント | アカウントの作成
コメントは投稿者の責任においてなされるものであり、サイト管理者は責任を負いません。
変換できました
投稿者は: ゲストユーザ on 金曜日, 8月 17 2007 @ 11:02 午後 JST
Windows上での変換にちょっと苦労しましたが、なんとか無事変換でき、快適に利用できています。wikipediaをローカルでさくさくと読み進められるのが気に入っています。

変換は、WinXP SP2で行ったのですが、何故かcygwin (最新版)の perlが 止まってしまう箇所があったので、
そこだけは ActivePerlを用いました。うまくいかなかったのは2箇所で、

1箇所目:fpwwikipedia
/usr/local/libexec/freepwing/perl.sh fpwwikipedia \
-workdir work ./wikipedia.xml wikipedia-fpw.conf tables GFDL
ここで、20万語を過ぎたあたりで、perl.exe.stackdumpを出して、異常終了してしまいました。

これを ActivePerlで処理すると、無事最後まで処理できました。

2箇所目:fpwlink
こちらも、何故か異常終了するため、ActivePerlを用いて処理し、無事変化できました。

Windows上で変換する人は、あまりいないかもしれませんが、ご参考まで。

数式や表があればなお嬉しいですが、そう言うものが見たいときはWebを開けばいいわけで、
現状でも十分過ぎるくらい、便利に活用できそうです。貴重な変換ツールありがとうございました。