Kazuhiro's blog
ようこそ! Kazuhiro's blog
水曜日, 4月 24 2024 @ 03:16 午後 JST
 記事を友人にメールする 印刷用画面 

OALD7について

general

勢いあまってOALD7を買ってしまいました。 付属のCD-ROMをインストールする前に少し調べてみましたが暗号化はされておらず、圧縮されている部分もすぐに (zlibで) 伸長できました。 少し腕に覚えがあればFreePWINGやEBStudio向けの変換ツールを作成する事もそれほど困難ではないと思われます (xmlの解釈が面倒そうですが)。 尚、私は腕に覚えはありません。

変換ツールの作製に興味はあるが、買ってみて変換できませんでしたじゃ困るという人達むけの情報でした。

タグ:OALD7

 記事を友人にメールする 印刷用画面 

Lookup 1.99の更新

Lookup

SourceForge.netで公開されているLookup 1.99ですが、先程、CVSリポジトリにLookup 1.4, Lookup 1.4+mediaでのマルチメディア拡張等が取り込まれました。 川幡さんによるコミットで、川幡さんが独自に作業された部分も含まれているようです。

ただし、川幡さん自身はEmacs23でしか動作確認していないそうです。 UTF-8なファイルがあるのでそのファイルが読めることは必須条件ですが、Emacs22以前での動作は今のところ不明なようです(私もまだ確認していません)。 Lookup 1.99を使用されている方、試してみたい方はどうぞ。

(2007/07/19 追記) 現在のCVSリポジトリから取得できるものがNTEmacs 22.1で動作するのを確認しました。 ただし、確認といっても広辞苑第五版で検索と図の表示だけしか見ていません。

タグ:Lookup

 記事を友人にメールする 印刷用画面 

wikipedia-fpwを公開

general

前回紹介したウィキペディア日本語版のダンプデータからJIS X 4081な書籍を作るツールの続きです。取り敢えず相互参照できるようになったので公開しました

まだまだ整形がおかしかったり、実体参照やそのままでは収録できない文字の変換テーブルも全然作っていないのですが、いつまでたっても終わらない気がしたので気がついたら修正していくことにします。

正直なところ、Perlを知らない人間が動けばよしで書いたコードです。 変換テーブルの追加や修正、ツール自体の修正等ありましたらお気軽にどうぞ。

タグ:Wikipedia FreePWING EPWING

 記事を友人にメールする 印刷用画面 

WikipediaのダンプデータをJIS X 4081に変換する

general

ウィキペディア日本語版のダンプデータをFreePWINGで処理してみました。 UTF-8な文字とか画像とか音声とか数式とか表とかは全てオミットして、何も考えずに表示できるテキストだけ抽出しています。 他項目へのリダイレクト等を省いて約43万弱の項目があり、HONMONファイルは約1.2GBになりました。

ちなみに、本当は英語版のウィキペディアに挑戦しようと思ったのですが、ダンプデータが圧縮した状態で2.5GBというのを見て一瞬で方針を変更しました。

やっつけっぷりのかなりひどいコードですが、相互参照を扱えるようにできれば一度公開してみようかと思います。

タグ:Wikipedia FreePWING EPWING

 記事を友人にメールする 印刷用画面 

eblookとreadline

Lookup

NetBSD環境が使えるようになったのでEmacs, Lookup, eblookとインストールしてみました。

どうもeblookはreadlineを有効にすると動作が怪しくなるようです。 丸山さんのところのように落ちはしませんが、pkgsrcでインストールしたreadline-5.2をリンクすると多くの日本語を含んだ文字の検索ができなくなります。 iconvを外してみたりもしましたが結果は変わりませんでした。 Lookupから使う分には必要のない機能なので、リンクしないという後ろ向きな方法で回避しておく事にしました。

ついでに、BSD makeだとLookupのmakeに失敗することに気がつきました。 こっちはできればどうにかしたいです。

(2007/05/29 追記) BSD makeについてはどうにかしました。 手元の環境ではBSD makeでもGNU makeでもmakeできるようになりました。

(2007/05/31 追記) readlineについてですが、pkgsrcでインストールしたreadlineのライブラリにリンクはしていましたが、ヘッダファイルはシステムに付属のものを読み込んでいたというオチでした。 正しいヘッダファイルを指定すれば問題なく動作しました。 また、NetBSDに付属の(多分)libeditを使用した場合は動作がおかしくなりました。

タグ:eblook Readline NetBSD