EB4Jによる通信用語の基礎知識のJIS X 4081化
EB4Jという、EB Libraryを元にしたpure Javaな電子辞書関連クラスライブラリがあります。 あるのは以前から知っていたのですが、通信用語の基礎知識や郵便番号データをJIS X 4081化するプログラムが付属しているのは知りませんでした。 特に、通信用語の基礎知識に関してはプラグインデータや表にも対応しており、今回はそれを使って通信用語の基礎知識の変換してみました。
(本当はもっと以前に一度挑戦したのですが、その時は最新版のデータに対応していなくて変換できなかったので二度目の挑戦です。)
変換に使用した環境はopenSUSE 11.1 (x86_64, 4GB)上のopenJDKです。 概ねインストラクション通りでいけますが、javaがメモリ不足で止まるので、conv-wdic.shとxml2eb.shにある、最大ヒープサイズの指定する部分(-Xmxオプション)を3000mとかにしておきました。 また、プラグインのファイルは全てが存在していない場合にはfatalとメッセージが出るので、存在しないファイルに対してはダミーのファイルへのリンクを張るなどしています。
ついでに、eblook 1.6.1+mediaで24ビットbmpからppmへの変換がうまく動作していないことに気付いてしまいましたので修正しました。