Mozc+dictという名前で配布してみる。
★Mozc+dictの特徴
(これより下の画像は「サジェストの最大候補数」を 9 にして撮影)
1. 新語・流行語・アニメ・その他諸々を追加
2. 俗語・ネットスラングなども追加

3. 基本的な言葉を追加したり直したり(案外Mozcは語彙が抜けている)
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
【注意】この記事は ver-0.13.523.102 の時に書きました。違うバージョンでは修正されているかもしれません
4. もしかして機能(よくある誤字・誤用を修正)
現段階では対応している単語は少ない。ちまちま増やしていく。

上の画像は scim-mozc です。ibus-mozc は <もしかして> が表示されません
5. 郵便番号辞書を正確にした
Mozc本体に同梱されている郵便辞書作成スクリプト(gen_zip_code_seed.py)は、仕様が無茶苦茶な郵便番号データに対応しきれていません。その辺を少し修正。
![]() | → | ![]() |
★インストール
Ubuntu(Debian)とFedora(CentOS・Scientific Linux)用のDeb/RPMをリポジトリに置きました。インストール方法は APT/YUM の設定をした後、•Ubuntuの場合 mozc-server+dict と ibus-mozc を入れればOK。コマンドでやるなら $ sudo apt-get update && sudo apt-get -y install mozc-server+dict ibus-mozcそして、初めてMozcを使う人はこちらに書いたiBusの設定をしてください。•Fedoraの場合 mozcがインストール済みだったら、一度消す必要がある $ su # rpm -e --nodeps mozc # yum -y install mozc+dict ibus-mozc•PCLinuxOSの場合 tomcatさんがパッケージを作ってくれています → Operation Normal ? | mozc+sawadict パッケージ for PCLinuxOS
「バージョン」を変換して「Mozc+dict-〜」と表示されたらインストール成功です。
★ユーザー辞書として使う
Google-IME用のユーザー辞書形式に変換したファイルを置いときます→ file/mozc/ (システム辞書形式のファイルも入っています)
私の胡散臭いリポジトリを使いたくない人は、これを辞書ツールからインポートすればいいです。ただし、ユーザー辞書は優先度調整ができません(全ての語句が一律に高い優先度になる?)。システム辞書として本体に組み込んだときよりも、変換が変になりやすいです。例えば「いちごいちえ」の第一候補が「一期一会」ではなく、追加辞書の「一五一会」「苺いちえ」になる可能性が高い。★既知の不具合
1. 読みが17文字以上あるはずなのに16文字までしか付いていない
辞書の作成に利用させてもらっているはてなダイアリーキーワードふりがなリストの仕様です。Yahoo!のテキスト解析Web APIを使ってだいぶ修正しましたが、自動で振り仮名が取れない語句も沢山あって、まだチェックしきれていません。Tabで予測変換してください。
(例:こうれいしゃのきょじゅうのあんて→高齢者の居住の安定確保に関する法律)
(例:こうれいしゃのきょじゅうのあんて→高齢者の居住の安定確保に関する法律)
2. 読みと単語が全然違う語句がある
はてなキーワードの仕様です。見つけ次第、修正する
(例:さとり→小五ロリ)
(例:さとり→小五ロリ)
3. 誤字がある
見つけ次第、修正する
(例:がまごおしり[蒲郡市]→がまごおりし)
(例:がまごおしり[蒲郡市]→がまごおりし)
★その他
自然言語処理の素人が作っています。全体的に標準辞書より優先度を低めにしているので、極端に変なことにはならないと思いますが、変換精度が悪化している部分もあるはずです。その辺、ご理解の程を…それと、Mozc+dictの不具合をGoogleに送らないでくださいね。あくまで別モノです。
★ToDo
- 定期的に新語を追加
リスト::誤記の誤字を消す(済)- 他の不要な語句も消す
- 品詞を直す
ことわざ、四字熟語を増やす→ 酔生夢死のTHUさんにお世話していただきました。ありがとうございます。- 辞書を大きくしたからといって良くなるとは限らないだろうけど、まあ、色々してみようかなっと
★他の辞書の紹介
- Mozc UT Dictionary
システム辞書に追加して使う辞書です - google-ime-user-dictionary-ja-en
Google日本語入力の和英辞書作成プロジェクト - Google日本語入力強化辞書
26万語以上を収めた巨大な追加辞書です。
カナ英辞書・英カナ辞書・英英辞書・英和辞書・和英辞書も入っています。 - ニコニコ大百科IME辞書
ニコニコ大百科のキーワードを辞書化したものです。アレゲな人には便利なアイテムだと思います。アレゲすぎて日常の変換に支障が出るかもしれませんが(^^; - 2ちゃんねる顔文字辞書 MatsuCon
標準の顔文字だけだと物足りない人は使ってみよう - Google日本語入力で韓国語 (ハングル) をアルファベットで入力する
日本語入力で韓国語を打つ
09:50 pm | コメントする |
31. けんけん (Website) 2011/07/12 14:54
郵便番号が出るヨォ。ネットのスラングもいっぱい出る〜〜♪
素敵です。
私のblogコメで書きましたが、
郵便番号、***-****を
sed s/-// user-dict-postal.txt > user-dict-postal-no-bar.txt
して、user-dict-postal-no-bar.txtを辞書追加すれば、
********変換で住所変換出来ます。
-アリが必要かどうかは個人差があるかな?
32.
Sawa 2011/07/13 08:45
どちらかというと、ハイフン有りの方が一般的なようです。MS-IMEやGoogle日本語入力の郵便番号辞書はハイフン付きだし、たしかATOKもそうだったような(設定で変えられたかも)
33. NONAME 2011/07/16 20:57
> MS-IMEやGoogle日本語入力の郵便番号辞書はハイフン付きだし、たしかATOKもそうだったような(設定で変えられたかも)
Mozcの場合、サジェストもありますからね。
郵便番号辞書をハイフンなしにすると、表計算ソフトや金額の入力とかで長い数字を入力するたびに住所がサジェストされて鬱陶しいことになったりして。
34. morikuma 2012/03/08 01:35
ありがとうございました。
35.
Sawa 2012/03/09 01:05
私もやってみようかな。
36. morikuma 2012/03/10 03:16
手持ちのThinkPad R40にUbuntu11.10を入れたので早速使わせてもらってます。
自分にとってはもう「必須アプリ」となってしまいましたw
友人達にも好評です。
37. NONAME 2012/04/02 23:27
mozc+dictをインストールしたら予測に出てこなくなりました。
バグですか?
38.
Sawa 2012/04/03 00:27
http://blog.cnu.jp/2012/02/01/mozc-suggest/
39. NONAME 2012/04/03 18:06
40.
Sawa 2012/04/04 00:22
それと、電話番号はハイフン付きだと覚えますよ。
または全角文字を一文字入れるとか。
41. NONAME 2012/04/08 03:17
42.
Sawa 2012/04/11 01:08
43. YP 2012/05/04 16:31
憩いの場のPPAを登録し、Synapticパッケージマネージャーからubuntu 12.04にmozc-server+dictをインストールしようとしたところ、次のようなメッセージが出て止まってしまいました。
mozc-serverは正常にインストール可能です。
(データベースを読み込んでいます ... 現在 177696 個のファイルとディレクトリがインストールされています。)
(.../mozc-server+dict_1%3a1.4.1033.102-1+20120402~ppa5_i386.deb から) mozc-server+dict を展開しています...
dpkg-deb (サブプロセス): コピー中にパイプへの書き込みに失敗しました のバッファコピーの読み取りに失敗しました: 入力/出力エラーです
xz: (stdin): 予期せず入力が終了しました
dpkg-deb (サブプロセス): サブプロセス データ はエラー終了ステータス 1 を返しました
dpkg-deb: error: サブプロセス <伸張> はエラー終了ステータス 2 を返しました
dpkg: /var/cache/apt/archives/mozc-server+dict_1%3a1.4.1033.102-1+20120402~ppa5_i386.deb の処理中にエラーが発生しました (--unpack):
`./usr/lib/mozc/mozc_server' 間の dpkg-deb バックエンド のバッファコピーの読み取りが不十分です
MaxReports にすでに達しているため、レポートは書き込まれません
以下のパッケージの処理中にエラーが発生しました:
/var/cache/apt/archives/mozc-server+dict_1%3a1.4.1033.102-1+20120402~ppa5_i386.deb
E: Sub-process /usr/bin/dpkg returned an error code (1)
パッケージのインストールに失敗しました。修復を試行しています:
何か対処法はありますでしょうか。
44.
Sawa 2012/05/04 23:10
キャッシュを消して再試行したらどうでしょうか
$ sudo apt-get clean
$ sudo apt-get install -f mozc-server+dict
45. YP 2012/05/05 01:05
アドバイスありがとうございました。
46. NONAME 2012/09/12 00:49
Mozc+dictのライセンスについて質問があります。
最近、Mozc+dict付属のREADME.txtに
> ただし、いろいろあって、商用利用は駄目です
と書かれているのに気づきました。PPAで公開できるソフトウェアのライセンスは、
https://help.launchpad.net/PPATermsofUse
に挙げられているものに限られていたと理解しているのですが、Mozc+dictの具体的なライセンスは何にあたるのでしょうか?
よろしくお願いいたします。
47.
Sawa 2012/09/12 08:14
Ubuntuの分類では、nvidiaやfglrxのドライバと同じrestricted(制限付き)に当たりますね。
利用させてもらっている
http://www7b.biglobe.ne.jp/~kenken_y/zipcsv/zip01.html
の関係で、そういう文言になっています。
何か問題があるのなら教えてください <(_ _)>
48. NONAME 2012/09/12 10:37
以下のパッケージには満たせない依存関係があります:
mozc-server+dict : 先行依存: mozc-utils-gui (>= 1:1.6.1187.102) しかし、1:1.6.1187.102-0~ppa5 はインストールされようとしています
E: 問題を解決することができません。壊れた変更禁止パッケージがあります。
のメッセージが出てインストールできませんでした。
ひょっとしてどちらかのパッケージの内部バージョンが間違えているとかそういうことはないでしょうか。
49. NONAME 2012/09/12 11:54
「壊れた変更禁止パッケージ」のエラーでインストールできませんでした。
なお、「mozc-server」のパッケージも同様のエラーが出ます。
50. またまた∞帰ってきた某所の匿名 2012/09/12 17:28
51. yukoba 2012/09/13 00:11
1:1.6.1187.102-1+20120911~ppa5 で直ってますよ。
52.
Sawa 2012/09/13 00:15
apt-get updateすれば直ると思います。
53. NONAME 2012/09/13 00:52
> Ubuntuの分類では、nvidiaやfglrxのドライバと同じrestricted(制限付き)に当たりますね。
それが、Ubuntu restrictedは「非商用利用のみ」のような条項を禁止しているのです。
http://www.ubuntu.com/project/about-ubuntu/licensing
> Must not discriminate against persons, groups or against fields of
> endeavour. The licence of software included in Ubuntu can not
> discriminate against anyone or any group of users and cannot restrict
> users from using the software for a particular field of endeavour
> - a business for example. So we will not distribute software that is
> licensed "freely for non-commercial use".
このままでは、Mozc+dictがPPAの利用規約違反になってしまうのではないかと心配する次第です。
54. またまた∞帰ってきた某所の匿名 2012/09/13 15:12
PPAで利用されるソフトウェアが、Ubuntuの利用規約に準ずるという項目はどこにあるのですか?
PPAのソフトウェアは、Cannonicalが管理してるけど、Ubuntuの正規ソフトウェアではありません。
55. またまた∞帰ってきた某所の匿名 2012/09/13 15:49
前言取り消します。
56.
Sawa 2012/09/13 20:30
いい機会だし、+dictの公開を中止しようかな。
あとでオリジナルのMozcに切り替わるパッケージをPPAにUPします。
ところで話が変わりますが、先日発生した依存関係エラーは、
私がdebのバージョンの優先度を知らなかったのが原因です。
1.0-0 < 1.0 < 1.0-1
こうなるのですね…
アホな失敗をしました。