ちょいとCC100-jaからlibkkc向けに辞書を作ることができたので、辞書を差し替えてテスト入力しているところ。
まだ使い始めたばかりなので使用感については何とも言えないけどとりあえずはこの程度の文章を打つことはできているみたい。
悪くはない感じがするけど、良いかどうかは何とも言えない。日本語ウェブコーパス2010の頻度750以上で作った辞書から入れ替えていて、語彙数がだいぶ減っている点(80280→63525)が気にかかるところではある。とはいえ単に多けりゃ良いってもんでもないだろうし、長時間使ってみないと分からんなあ。
(下手に増やすとノイズを拾って意図しない変換が増えて逆にストレスになるというのもある)
自分自身で言語資源から辞書を起こせる、という点に意義があるかなあ。
(ここで「てんに」が「点2」しか変換できずむきーっとなっている)
あれー?数字は候補から外すようにしてたはずな気がするんだけど。後でdata.arpaとか見てみるか。
やっぱ「てんに/点2」なんてのは見つからないんだが…うーむ…?
CC100-ja/頻度75辞書を作ってみたけど、中二病ならぬ点2病は治ってないねえ…メモリ消費量も多めだし。頻度100辞書に戻すかどうかが悩ましい。