亜細亜ノ蛾 - Weblog

[SiteSearch Google]

August 09, 2006

Migemoの辞書を軽くする2つの方法

[ad]

  • 更新: 2008 年 05 月 19 日 00:25
  • 2006 年 08 月 09 日 23:34 に asiamoth が投稿
  • カテゴリー: PC
  • コメントする

日々是みげも

毎日、何らかの形でMigemoを利用しています。便利すぎです。

Migemoの情報を探していると、SKK辞書のWikiに、Migemoに関する記述がありました。

(Migemoは)SKK 辞書を利用しています。標準ではL辞書からmigemo辞書を作成するようですが、代わりにML辞書を使用すると高速かつ程良いヒットが得られるようです。

リンク集 - SkkWiki

「ようです」というのがかなり気になります。気になったからには、確認したい──。

ということで、ML辞書からMigemo辞書作ってみました!

*migemo-dict.zip

利用の際は上記のZIPファイルを解凍し、標準の“migemo-dict”と入れ替えてください。もちろん、“migemo-dict”はバックアップを忘れずに!

ML辞書は1MByteも無いので手頃です。しかし、ここからmigemo-dictを作るのは大変だった──。

Migemo辞書のレシピ

  1. SKK ML辞書をダウンロード
  2. /をタブに変換
  3. コメントを削除(;[^\t\n]+\tを削除してから;[^\t\n]+$を削除)
  4. ^[^\t]の数が多い順に並べる
  5. 元のmigemo-dictから「一文字記号」をコピー

──とまぁ、こんな感じ(数ヶ月前の話なのでうろ覚え)。

おそらく、二度手間・三度手間の余分な作業が混じっていると思います。こういったときに、簡単にスクリプトが組めれば──。

もう一つの方法

上記以外にも、こんな方法があります。

おい!あふを語ろうぜ!Ver.15を見ると、

あーくとう から上は全部削ったら、サイズが半分以下になった

と書いてあります。

最初は「?」だったのですが、標準の“migemo-dict”をテキストエディタで開いて、納得。

「あーくとう」で検索すると、中間あたりに見つかります。

よくよく見てみると、“migemo-dict”は、Migemoで補完する単語が「文字数の多い順」に並んでいます。

要するに、そんなに文字数の多い物を補完しても仕方がないので削除しよう、ということです。

「あーくとう」から上を削除すると、辞書サイズは1.2MByteくらいになります。こっちでもいいかも。

使ってみた感想

上記の二つの辞書でしばらく使ってみましたが、どちらも、得に違和感はないですね。

以前と比べて、何か検索できなくなった、ということもありません。

むしろ、もう少し、辞書のサイズを減らしても良さそうです。またいい方法が見つかったら、記事にしてみます。

Google Adsense

 

Related Posts with Thumbnails

コメント

コメントを投稿

"Migemoの辞書を軽くする2つの方法" にコメントを投稿することができます。お気軽にどうぞ。

過去の記事

カテゴリィ一覧
  1. その他
    1. 食・健康・生活
  2. ウェブデザイン・文章
    1. Movable Type
  3. ウェブ上で見つけたページ
  4. コンピュータ・エレクトロニクス
    1. PC
      1. Firefox
    2. カメラ・デジタルカメラ
  5. マンガ・アニメ・ゲーム
    1. エヴァンゲリオン/ ヱヴァンゲリヲン
    2. マンガ
      1. DEATH NOTE
      2. HUNTER×HUNTER
      3. SKET DANCE
      4. バクマン。
  6. 本・音楽・映画・TV
    1. 映画