Kazuhiro's blog
ようこそ! Kazuhiro's blog
金曜日, 3月 31 2017 @ 05:21 午前 JST
 記事を友人にメールする 印刷用画面 

OALD7をFreePWINGで変換

general

できなくもなさそうという事で、とりあえずテキストだけやってみました。 書式はちょっとだけ整えましたが、ほとんどxmlのタグを取っ払っただけです。

画像がJPG、音声がMP3なので、この辺のデータも入れるのならFreePWINGよりはEBStudioでの変換を試みた方がよいと思います。

個人的には辞書の変換よりは直接ひく方に興味があるのですが、インデックスがなんだかよく分かりません。

タグ:OALD7 FreePWING EPWING

 記事を友人にメールする 印刷用画面 

OALD7について

general

勢いあまってOALD7を買ってしまいました。 付属のCD-ROMをインストールする前に少し調べてみましたが暗号化はされておらず、圧縮されている部分もすぐに (zlibで) 伸長できました。 少し腕に覚えがあればFreePWINGやEBStudio向けの変換ツールを作成する事もそれほど困難ではないと思われます (xmlの解釈が面倒そうですが)。 尚、私は腕に覚えはありません。

変換ツールの作製に興味はあるが、買ってみて変換できませんでしたじゃ困るという人達むけの情報でした。

タグ:OALD7

 記事を友人にメールする 印刷用画面 

Lookup 1.99の更新

Lookup

SourceForge.netで公開されているLookup 1.99ですが、先程、CVSリポジトリにLookup 1.4, Lookup 1.4+mediaでのマルチメディア拡張等が取り込まれました。 川幡さんによるコミットで、川幡さんが独自に作業された部分も含まれているようです。

ただし、川幡さん自身はEmacs23でしか動作確認していないそうです。 UTF-8なファイルがあるのでそのファイルが読めることは必須条件ですが、Emacs22以前での動作は今のところ不明なようです(私もまだ確認していません)。 Lookup 1.99を使用されている方、試してみたい方はどうぞ。

(2007/07/19 追記) 現在のCVSリポジトリから取得できるものがNTEmacs 22.1で動作するのを確認しました。 ただし、確認といっても広辞苑第五版で検索と図の表示だけしか見ていません。

タグ:Lookup

 記事を友人にメールする 印刷用画面 

wikipedia-fpwを公開

general

前回紹介したウィキペディア日本語版のダンプデータからJIS X 4081な書籍を作るツールの続きです。取り敢えず相互参照できるようになったので公開しました

まだまだ整形がおかしかったり、実体参照やそのままでは収録できない文字の変換テーブルも全然作っていないのですが、いつまでたっても終わらない気がしたので気がついたら修正していくことにします。

正直なところ、Perlを知らない人間が動けばよしで書いたコードです。 変換テーブルの追加や修正、ツール自体の修正等ありましたらお気軽にどうぞ。

タグ:Wikipedia FreePWING EPWING

 記事を友人にメールする 印刷用画面 

WikipediaのダンプデータをJIS X 4081に変換する

general

ウィキペディア日本語版のダンプデータをFreePWINGで処理してみました。 UTF-8な文字とか画像とか音声とか数式とか表とかは全てオミットして、何も考えずに表示できるテキストだけ抽出しています。 他項目へのリダイレクト等を省いて約43万弱の項目があり、HONMONファイルは約1.2GBになりました。

ちなみに、本当は英語版のウィキペディアに挑戦しようと思ったのですが、ダンプデータが圧縮した状態で2.5GBというのを見て一瞬で方針を変更しました。

やっつけっぷりのかなりひどいコードですが、相互参照を扱えるようにできれば一度公開してみようかと思います。

タグ:Wikipedia FreePWING EPWING