Kazuhiro's blog
ようこそ! Kazuhiro's blog
火曜日, 11月 05 2024 @ 01:10 午後 JST

lookup-kanji.el の拡張について

lookup-kanji.el の拡張について

Lookupではテキストからの検索語の切り出し、読みを検索するndkksエージェント、漢字を含む検索語から読みを検索するlookup-kanji-get-readings関数において形態素解析エンジンとしてKAKASIを利用しています。 Lookup 1.4+mediaでは、これらのコードを統合し、また、ChaSenMeCabの様な他の形態素解析エンジンを利用しやすいように変更を加えています。

for your download, インストール

Lookup 1.4+mediaに含まれています。

追加される機能、従来からの変更
変数lookup-kanji-schemeの新設

利用する形態素解析エンジン名のシンボルを指定します。 現在のところ、kakasi, chasen, mecabの3種類が用意されています。 デフォルトはnilで、~/.lookup等により、lookup-kanji.elの読み込み前に明示的に指定しないとこれらの機能は有効になりません。

変数lookup-use-kakasiの初期値の変更

lookup-kanji-schemenon-nilの場合にtとなります。

lookup-kanji-command, lookup-kanji-option, lookup-kanji-coding-system, ndkks-program-name, ndkks-content-format, ndkks-process-coding-systemの廃止

lookup-kanji-schemeの設定によりますが、相当する別の変数が存在するはずなので、そちらを設定してください。

KAKASIを利用する時に参照される変数

lookup-kanji-schemeで、kakasiを指定した場合はこれらの変数が参照されます。

lookup-kanji-kakasi-program-name

KAKASIのプログラム名を文字列で指定します。 パスが通っていない場合はフルパスで指定してください。 デフォルト値は"kakasi"です。

lookup-kanji-kakasi-coding-system

KAKASIプロセスとの通信時に使用する文字コードを指定します。

lookup-kanji-kakasi-program-args

KAKASIプロセスの起動時に指定する引数を文字列のリストで設定します。 ここで設定した内容はKAKASIを起動する際には常に参照されます。 デフォルト値はnilです。

lookup-kanji-kakasi-program-args-for-wakati

テキストからの検索語の切り出しにKAKASIプロセスを起動する際に指定する引数を文字列のリストで設定します。 実際の引数はlookup-kanji-kakasi-program-argsとこの値から決定されます。 通常は変更する必要はありません。

lookup-kanji-kakasi-program-args-for-hiragana

lookup-kanji-get-readings関数がkakasiプロセスを起動する際に指定するオプションを文字列のリストで設定します。 実際の引数はlookup-kanji-kakasi-program-argsとこの値から決定されます。 通常は変更する必要はありません。

lookup-kanji-kakasi-content-format

従来のndkks-content-formatに相当する内容を設定します。

ChaSenを利用する時に参照される変数

lookup-kanji-schemeで、chasenを指定した場合はこれらの変数が参照されます。

lookup-kanji-chasen-program-name
lookup-kanji-chasen-coding-system
lookup-kanji-chasen-program-args
lookup-kanji-chasen-program-args-for-wakati
lookup-kanji-chasen-program-args-for-hiragana
lookup-kanji-chasen-content-format

KAKASIを利用する場合に相当する変数の説明を参照してください。

MeCabを利用する時に参照される変数

lookup-kanji-schemeで、mecabを指定した場合はこれらの変数が参照されます。

lookup-kanji-mecab-program-name
lookup-kanji-mecab-coding-system
lookup-kanji-mecab-program-args
lookup-kanji-mecab-program-args-for-wakati
lookup-kanji-mecab-program-args-for-hiragana
lookup-kanji-mecab-content-format

KAKASIを利用する場合に相当する変数の説明を参照してください。

設定例

例えば、Windows環境で従来通りにKAKASIを使用する場合は、~/.lookupに以下のように記述してください。

(setq lookup-kanji-scheme 'kakasi
      lookup-kanji-kakasi-coding-system 'sjis)

MeCabをutf-8で利用し、特定の辞書を指定する場合は以下のように記述してください。

(setq lookup-kanji-scheme 'mecab
      lookup-kanji-mecab-coding-system 'utf-8
      lookup-kanji-mecab-program-args
      '("-d" "/path/to/your/dic"))

検索語の切り出しを利用しない場合はlookup-use-kakasiを明示的にnilにしてください。

(setq lookup-kanji-scheme 'kakasi
      lookup-use-kakasi nil)

更新履歴

2010/04/03 公開。


最終更新日: 土曜日, 4月 03 2010 @ 06:46 午後 JST; 15,081 閲覧件数 印刷用画面