PDIC形式の辞書をJIS X 4081に変換する (EBStudioで)

火曜日, 2月 13 2007 @ 07:24 午後 JST

投稿者: kazuhiro

PDIC形式の辞書をLookupから使いたくなりました。

テキスト形式の辞書が公開されていればEBStudioでそのまま変換できます。 多分FreePWINGでも割と簡単に変換できると思います。 しかし、使いたい辞書はテキスト形式のデータは公開されていませんでした。 公開している方にお願いすればテキスト形式のデータも公開して頂けるかもしれませんが、それはなんだか負けた気がするのでとりあえずあがいてみました。

PDIC形式の辞書は仕様も公開されているので、頑張れば検索ツールを作れる筈です。 ツールを作ってエージェントもそれに合わせて作るというのが見栄えのよい方法のように思います。 いちいち変換しなくいいし。 しかしながらそんなにリソースは注げないので、PDIC Toolkitを使ってEBStudioが読み込めるhtml形式に変換するツールを書きました。 といっても付属のpdic2txtをちょっと書き換えただけです。

for your download

pdic2html-20070213.pl

コンソールから以下のように使います。

$perl ./pdic2html.pl <dictionaey-filename> [output-filename] [--title=title-name]

dictionary-filenameはPDIC形式の辞書のファイル名を指定します。 PDIC形式の辞書は必ずファイル名が".DIC"で終わっていないといけません。 output-filenameは出力先のファイル名を指定します。省略可能です。 ファイル名が".html"で終わっていない場合は付け加えられます。 title-nameは辞書のタイトルを指定します。 できるだけ指定して下さい。

日本語・英語の辞書についてはそれなりにうまくいくはずです。 他の言語の辞書については、検索ツールやPDIC Viewer for Emacsを利用したLookupのエージェントを作る方向で考えた方がよいように思います。

(2007/2/16 追記) Personal Dictionary for Win32やPersonal Dictionary for DOSには、PDIC形式からテキスト形式へ辞書を変換する機能が備わっています。 つまり、EBStudioが動く環境では上記ソフトも動くのでこのスクリプトを使う必要はほとんどありません。 最終的にはFreePWINGに対応させる予定で、試しにすぐ書けそうなEBStudio用のコードを書いてみたというものです。

タグ:PDIC EPWING EBStudio

コメント (0件)


Kazuhiro's blog
http://ikazuhiro.s206.xrea.com/article.php/20070213192424492