トップページ | 過去記事(月別カテゴリー別) | 掲示板 | 野良DEB,RPM | 更新チェック | Twitter
<<  2010.4  >>
SMTWTFS
    123
45678910
11121314151617
18192021222324
252627282930 
 
リンク
その他
  • RSS2.0
  • Credit

  • SEO
    loading

    プライバシーポリシー
    Google

カテゴリー » Linux April 05, 2010

Modified AnthyでLinuxの日本語変換を向上させる Linux

Linux標準の日本語入力はAnthyなわけですが、主要開発者による開発は終了状態です。そんな中、変換能力が少しでも上がるようにと、G-HALさんという方が改造パッチを作ってくれています。さらに、UTUMIさんという方が辞書の中身を強化・調整し、パッチを含めた物をModified Anthyとして配布してくれています。オリジナルとの違いは
  1. 学習データの保存量を増加。使用者の変換の癖をちゃんと覚えてくれるようになる。
  2. 辞書の大幅な強化。単語の追加だけでなく、検索サイトのヒット数に基づいて頻度の調整が施されている。
  3. 別の変換アルゴリズム「N文節最長一致」を利用できる(anthy-confで設定)
  4. 学習データファイルが大きくなってくると、最初の読み込みに少し時間が掛かるようになる?
  5. ある程度学習データが溜まるまで、変換精度はオリジナルとあまり変わらない? 少なくとも辞書強化の効果はあるだろうけど。
  6. その他色々。頑張って解説を読んでね。
そのModified Anthyをパッケージ化してみました → リポジトリ

インストール方法は、リポジトリを追加したらアップデートするだけです。自動で入れ替わります。

既にAnthyを使用していた場合、下のコマンドで学習データの形式を変換した方がいいらしい。
$ rm -f ~/.anthy/last-record1_*.bin
$ anthy-agent --do-nothing --update-base-record
$ rm -f ~/.anthy/last-record1_*.bin
$ anthy-agent --do-nothing --update-base-record
(同じ事を2回繰り返していますが、間違いではありません)
Ubuntu(Debian)のAnthyは、update-anthy-dics コマンドで辞書を再構築する機能がありますが、私のパッケージはその仕組みを入れていません。辞書の追加は $HOME/.anthy/imported_words_default.d/ にコピーしてください

≪追記≫
うれしいことに、Anthyの開発が再開されました
[Anthy-dev 3726] Re: 新開発体制について

止まってます(^_^;)

≪追記≫
同梱していた顔文字辞書を外しました。その他、上の説明を少し変更。

≪追記≫
Modified Anthyを消して、G-HALさんのAnthyを置きました。
12:31 am | コメントする |

上の記事に対するコメント

1. oddy_e  2010/04/28 09:29
無料ですから変換効率の悪さも仕方ないと諦めていたところでした。
良い情報をありがとうございます。

2. nekoyama  2010/10/02 00:07
ありがとうございます.
Ubuntu 10.04 LTSに,リポジトリ追加して入れてます.

FireFox3.6.10で,

"ニコッとタウン" (http://www.nicotto.jp/)

の,Flash画面でのチャットで,[半角/全角]キーを押しても
上手くscim + AnthyがONになりません.

同じ画面が出ている時に,ツールバーの検索とかURLを入力する所に
カーソルを移動すると,[半角/全角]キーでON/OFF出来ます.

別のサイトのFlash画面の日本語では大丈夫そうだったんですけれど…
(確認してなかった…http://www.atgames.jp/では上手く動いてた
気がしたんですけれど…見直してみます.)

ニコッとのチャットでは動きませんでした.

エラーログを出して確認することが出来ますか?

3. nekoyama  2010/10/02 00:42
やっぱり,
@games(http://www.atgames.jp/)
でも出来ませんでした.

サイトの掲示板等では大丈夫なんですが,
Flashコンテンツ内に日本語入力する所で
ON出来ない様子です.

4. Owner CommentSawa  2010/10/02 15:43
mozilla.gr.jp のテストページで
http://bugzilla-attachments.mozilla.gr.jp/attachment.cgi?id=2275
入力可能か確認してみてください(左下に変換候補が出るかも)

駄目なら
・ibus-anthyで日本語入力かどうかを確認する
・試しにOOPP機能を無効にしてみる http://tomcat.nyanta.jp/sb2/sb.cgi?eid=326

5. NONAME  2010/10/18 21:56
端末に①、追記3コピペenterすると共に,デレクトリではありません。と

6. Owner CommentSawa  2010/10/24 10:41
無いのなら自分でディレクトリを作ってくださいませ。
それと、記号を分離するのは止めました。

7. NONAME  2012/08/21 19:56
Debian6.0でリポジトリを利用させていただいています。大変便利です。ありがとうございます。
apt-get source でソースファイルもダウンロードできるようにできないでしょうか?
よろしくおねがいします。

8. Owner CommentSawa  2012/08/21 21:45
ビルドに利用させてもらっているopenSUSE Build Serviceの仕様で、Debianのソースリポジトリが作れないんですよね。

面倒くさいかもしれませんが、手動でダウンロードしてください。
https://build.opensuse.org/package/files?package=Modified_Anthy&project=home%3Asawaa

9. Owner CommentSawa  2012/08/21 21:47
あー、なぜか orig.tar.bz2 がダウンロードできませんね。

こっちのほうがいいかな。
http://ppa.launchpad.net/ikoinoba/ppa/ubuntu/pool/main/a/anthy/

10. 7  2012/08/21 23:28
早速ありがとうございます!
下の方のリンクからダウンロードできました。

11. NONAME2  2012/08/24 22:02
バージョンが「20110409」となっています。
さすがに辞書が古くなってきたと思います。なんとかなりませんか

12. Owner CommentSawa  2012/08/25 22:47
私に言われても困ります。

配布元の anthydic-ut-devel を使って、ご自分で更新したらいいんじゃないかと。

コメントをどうぞ。名前とURLはオプションです。

Comment Form
NAME:
URL:
文字色:  

累計:20993、今日:377、昨日:634
Created in 0.0098 sec.