August 09, 2006
Migemoの辞書を軽くする2つの方法
日々是みげも
毎日、何らかの形でMigemoを利用しています。便利すぎです。
Migemoの情報を探していると、SKK辞書のWikiに、Migemoに関する記述がありました。
(Migemoは)SKK 辞書を利用しています。標準ではL辞書からmigemo辞書を作成するようですが、代わりにML辞書を使用すると高速かつ程良いヒットが得られるようです。
「ようです」というのがかなり気になります。気になったからには、確認したい──。
ということで、ML辞書からMigemo辞書作ってみました!
利用の際は上記のZIPファイルを解凍し、標準の“migemo-dict”と入れ替えてください。もちろん、“migemo-dict”はバックアップを忘れずに!
ML辞書は1MByteも無いので手頃です。しかし、ここからmigemo-dictを作るのは大変だった──。
Migemo辞書のレシピ
- SKK ML辞書をダウンロード
/をタブに変換- コメントを削除(
;[^\t\n]+\tを削除してから;[^\t\n]+$を削除) ^[^\t]の数が多い順に並べる- 元のmigemo-dictから「一文字記号」をコピー
──とまぁ、こんな感じ(数ヶ月前の話なのでうろ覚え)。
おそらく、二度手間・三度手間の余分な作業が混じっていると思います。こういったときに、簡単にスクリプトが組めれば──。
もう一つの方法
上記以外にも、こんな方法があります。
おい!あふを語ろうぜ!Ver.15を見ると、
あーくとう から上は全部削ったら、サイズが半分以下になった
と書いてあります。
最初は「?」だったのですが、標準の“migemo-dict”をテキストエディタで開いて、納得。
「あーくとう」で検索すると、中間あたりに見つかります。
よくよく見てみると、“migemo-dict”は、Migemoで補完する単語が「文字数の多い順」に並んでいます。
要するに、そんなに文字数の多い物を補完しても仕方がないので削除しよう、ということです。
「あーくとう」から上を削除すると、辞書サイズは1.2MByteくらいになります。こっちでもいいかも。
使ってみた感想
上記の二つの辞書でしばらく使ってみましたが、どちらも、得に違和感はないですね。
以前と比べて、何か検索できなくなった、ということもありません。
むしろ、もう少し、辞書のサイズを減らしても良さそうです。またいい方法が見つかったら、記事にしてみます。
コメント
コメントを投稿
"Migemoの辞書を軽くする2つの方法" にコメントを投稿することができます。お気軽にどうぞ。