ずっと以前にsrd-fpwを画像・音声対応にしようとしたことがありました。かなりad hocな変更で、できるのはできたのですが、その時に問題になったのが音声データの変換でした。
Windows版のランダムハウス英語辞典には、RealAudio形式で音声が収録されています。JIS X 4081に収納する為にはWAV形式に変換しないといけません。しかし、変換する手段というのがほとんどありませんでした。正確には手段はあったのですが、音声データの数が10万個以上あり、Ra2Wav等のようなGUIを備えた(CUIを持たない)ツールはあまり実用的ではありませんでした。また、Linux等ではReal Playerの出力を仮想の音声デバイスを経由してWAVに落とす手段があったようですが、変換時に再生に必要な実時間を丸々要するという欠点がありましたし、そもそもLinuxは触ったことがありません。MPlayerも試してみたのですが、当時(2006年春頃だったと思います)は変換後の音声の末尾にノイズが乗ってしまい、変換結果の質に極めて問題がある状態でした。
最終的にはMPlayerで変換後、末尾のノイズを削除するプログラムをでっち上げる事にしましたが、単純にある程度以下のレベルの音を削り取るだけだったので誤検出も多かったです。また、容量の問題で音声のビットレートをかなり落とす必要があり、音質が極めて悪い状態になってしまいました。
結局、音質に関しては改善は期待できないと判断し、JIS X 4081に変換して使うのはやめにしましたが、先日、MPlayer 1.0rc1でRealAudioからの変換を試してみたのですが、末尾のノイズは入らず、変換ツールとしてみるとずいぶんと改善されていました(本当は音声再生時の不具合の確認だったのですが、残念ながらそっちは健在でした)。ランダムハウス英語辞典のJIS X 4081への変換は、EBStudio用のツールキットが画像・音声を含めて既にサポートしているので、その際の音声変換ツールとして有用かもしれません。
コメント (0件)
Kazuhiro's blog
http://ikazuhiro.s206.xrea.com/article.php/20061209191517217