<<  2009.7  >>
SMTWTFS
   1234
567891011
12131415161718
19202122232425
262728293031 
 
リンク
その他
  • RSS2.0
  • Credit

  • SEO
    loading

    プライバシーポリシー

カテゴリー » 戯言 July 31, 2009

暇だったからPC作ってみた‐ニコニコ動画(ββ)

http://www.nicovideo.jp/watch/sm7783955

何という技術力…
10:42 pm | コメントする |

カテゴリー » Linux » いろいろ July 30, 2009

Linux標準日本語システム(Anthy)の変換能力を向上させる Linux

≪追記≫
この記事は少し古いです。新しいサイトの
http://linux.ikoinoba.net/index.php?UID=1270395085
に新しく書きました


Linuxの日本語入力と言えば一般的に Anthy が使われているわけですが、Wikipediaによると「主要開発者による開発は終了状態」だそうな。知らんかった、ビックリです。そんな先が思いやられるAnthyですけど、幾人の方達がメンテナンスを続けられてます。

かな漢字変換 anthy で、個人用学習データを活用して変換結果の改善を目指すパッチ
丘の道を登り
Modified Anthy

一番下のModified Anthyは上二つのパッチを含んでいる(最新版はalt-depgraphが省かれてるけど)ということで、Modified Anthyを適用したFedoraとUbuntu用のパッケージを作ってみました

rpm, deb置き場

インストールしたら一度ログアウトしてください

Ubuntuな人は anthy_9100h と libanthy0_9100h を同時に入れる必要があります
 $ sudo dpkg -i anthy_9100h*.deb libanthy0*.deb
個別に入れた場合は libanthy0_9100h が先じゃないと辞書の再作成が行われません。その際は自分で sudo update-anthy-dics

本家との違いは
  1. 学習データの保存量が増える
  2. 変換アルゴリズム「N文節最長一致」を実装。素のAnthyは「ビタビアルゴリズム」
  3. 辞書の強化。単語の追加だけでなく、検索サイトのヒット数に基づいて頻度の調整が施されている
  4. 他にもいろいろ修正してあるとのこと
注意として
  • 初回ログイン時に、これまで使ってきた学習データの形式が変換される。そのファイルがオリジナルで使えるかどうか未確認。yum、apt の設定で勝手にアップデートしないようにした方がいいと思う
  • 学習データファイルが大きくなってくると、最初の読み込みに時間が掛かるようになる?
  • ユーザ辞書やら何やらの一部が文字化けするかも? 詳細はiconv対応版の解説
  • ある程度学習データが溜まるまで、変換精度はオリジナルとあまり変わらない?

①Ⅻ㌖ 等の丸文字やローマ数字の辞書は 無効にしてあります。もし使いたいなら /usr/share/anthy/ 以下のどこかにある gt-tankanji_hikanji-34.t.norm と gt-tankanji_hikanji-uni.t.norm を $HOME/.anthy/imported_words_default.d/ にリンクしてください。

Fedora 11の人はIBusに学習しない不具合があるのでSCIMにした方がいいです
アップデートで直りました
11:55 pm

上の記事に対するコメントです

1. Rocco (Website)  2009/07/31 23:53
確かに ibus は使いにくいですね。(癖があるといった方が良いかもしれません。)
個人的にはあまり IME を信用していないので、今の Fedora 版 Anthy くらいだとほとんど不自由をかんじていなかったりしますけど、学習の容量が増えるのは魅力ですね。

2. Owner CommentSawa  2009/08/01 17:37
私のibusの不満ですが、「/」を押すと「/」が出てくるところが嫌です。windowsと同じ「・」が出てほしいのです。どこかにあるローマ字テーブルを定義しているファイルを書き換えればいいのでしょうが…

それと、ibusから単語登録する仕組みがまだ出来上がってないのは致命的だと思います。さすがFedora、いい意味でも悪い意味でも先進的! と感じました。

コメントする |

カテゴリー » Linux » Fedora July 27, 2009

Fedora 11 の IBus + Anthy は文節が分かれると学習しない Fedora

Fedora11を新規インストールしました。これまではFedora9にATOK X for Linux(X3ではない…)を無理やり入れて使っていたのですが、Fedora11では妙に不安定。入力できたり、できなかったりする。フォントが無いとエラーが出てパレットに文字が表示されないし、だめだこりゃ。

んでまあ、デフォルトのAnthyで日本語入力しとるわけです。やっぱりATOKXと比べて変換能力が劣ります。それでも誤変換の修正情報を覚えてくれれば、使っているうちにどんどん賢くなるわけですが…ほとんど学習しないんだな、これが。G-HALさんのパッチを当てても変化無し。一回前に入力した語句すら覚えてない事が多々ある。何かおかしい。

いろいろ試したところ、変換時に文節の区切りがあると学習しない事が判明。[Shift + ←] で文節を縮めても駄目。長文入力時の学習は絶望的ですな。Fedora 11で採用されたIBusが悪さしているようです。従来のSCIMを使った場合は問題無し。Emacs + anthy.el も大丈夫。

えーと、VMwareに新しくFedoraを入れての検証もしてみましたが、やっぱり同じ現象が起こりました。この不具合は私だけじゃないよね? Googleで検索しても全く情報が無いぞ。学習しない事は少し使えばすぐに感じるよね? 単文節で変換する人が多いのかな?

RedHatのBugzillaも見てみたけど、登録されているかどうか分からん…

≪追記 2009/07/30≫
SCIMに変更するには
# yum -y install scim-anthy scim-lang-japanese scim-bridge-gtk scim-tomoe
でインストールした後、[システム]→[設定]→[入力メソッド] で選択してログアウトすればいいです。ログアウト前に「入力メソッドの個人設定」から開始/終了キーを 半角/全角 しておくと幸せかも(デフォルトは ctrl+space)


≪追記 2009/09/05≫
アップデートで直りました
01:00 am

上の記事に対するコメントです

1. code_air_edge (Website)  2009/07/27 06:54
Anthyの場合、誤変換が非常に多いので、皆さん単文節でしか変換なさらない、ということもあるのでは…?
私も学習率は低いと思っていましたが、そもそもそういうものだろうと思ってしまっていました^^;

iBusからSCIMに戻すことで学習するようになるなら、戻しちゃおうかなぁ…。iBusに(利用の際の)メリットを感じてないです><

2. Rocco (Website)  2009/07/27 23:20
単文節しか変換しないので、気がつきませんでした。

現在、iBus を使っていますが、SCIM に戻すかどうか悩み中です。

3. Owner CommentSawa  2009/07/29 23:52
一個ずつ変換している人って多いのかな?
昔からコンピュータを使っている人は単文節で変換している人が多い気がします。
いや、実際どうだか知りませんが、Cannaとかそれより前の日本語変換の経験者は、おのずと単文節になるんじゃないかなーっと…

コメントする |

カテゴリー » Linux » Fedora July 15, 2009

Fedora 11 で VMware Player 2.5.2 / Workstation 6.5.2 (build-156735) Fedora

Fedora11 で VMware を試した時のメモ

まずはホストOSとして使ってみる
# rpm -Uvh VMware-Player-2.5.2-156735.i386.rpm
# yum -y install gcc make kernel-devel-$(uname -r)
$ vmplayer

Unable to build kernel module.
See log file /tmp/vmware-root/setup-4571.log for details.
いつものようにモジュールのコンパイルエラー発生。検索すると vmware-modules-2.6.29-portable.patch を発見。このパッチを適用した修正ファイルを置いておく中の *.tar を /usr/lib/vmware/modules/source/ にコピーして
# vmware-modconfig --console --install-all
警告が出まくるけど気にしない。


次はゲストOSとして使う場合。VMware Tools を入れてみる
# rpm -Uvh /media/VMware\ Tools/VMwareTools-7.8.5-156735.i386.rpm
# yum -y install gcc make kernel-devel-$(uname -r)
# vmware-config-tools.pl
...
/tmp/vmware-config0/vmmemctl-only/compat_wait.h:78: error: conflicting types for 'poll_initwait'
include/linux/poll.h:67: note: previous declaration of 'poll_initwait' was here
make[2]: *** [/tmp/vmware-config0/vmmemctl-only/os.o] Error 1
やっぱりエラー発生。修正パッチがVMware Communitiesにあるので、適用したファイルを置いておく中の *.tar をゲストの /usr/lib/vmware-tools/modules/source/ にコピーして、再度 vmware-config-tools.pl する。/mnt/hgfs/ の共有フォルダが使えて幸せ。
11:13 pm

上の記事に対するコメントです

1. Hiro  2009/08/06 12:22
Fedora 11で/mnt/hgfs/ の共有フォルダが使えて私も幸せになれました.ありがとうございます.

2. Oyaji  2009/08/13 10:55
ホストOSの場合、アップしていただいた修正ファイルで動作することはするんですが、ゲストOSのシャットダウン時に固まります。当方だけ?

3. Owner CommentSawa  2009/08/13 23:22
こちらでは問題ありません。
しかし、少し前からマウス透過が変で、ホストのウインドウをクリックしてもゲストからフォーカスが移るのに少し時間が掛かります。
これは私だけなのかなあ?

4. Oyaji  2009/08/30 16:55
上記6.5.2での問題は解決したのですが、6.5.3でWorkstationインストール途中のPlayerインストールの段階で、インストールが止まります。
http://communities.vmware.com/thread/227575
ここに同じ問題が出ているのですが、うまく行きません。kill -9 でプロセスを強制終了しようとしても<defunct>って表示がついてプロセス消えてないし。で、この解決策がここに載るのを待っている次第です(笑)

5. Owner CommentSawa  2009/09/02 00:31
ちょうどネタにするところでした。
http://fun.poosan.net/sawa/index.php?UID=1251816525

killで殺すのではなく/etc/vmware/databaseをリネームしてやればいいようです。

コメントする |

カテゴリー » 戯言 July 14, 2009

復活

ひさびさに書き込み
12:44 am

上の記事に対するコメントです

1. NONAME  2009/07/14 08:44
おかえり

コメントする |

累計:871359、今日:806、昨日:1776
Created in 0.0455 sec.