理想を言えば、よみがな/変換候補 なスタイルで形態素解析済な言語資源を言語モデル構築ツールを使ってdata.arpaを作るってのがベストなんだよね。その手法を採らない(採れない)のは、単純にストレージ容量の問題。
りそう/理想 を/を いえば/言えば よみがな/よみがな へんかん/変換 こうほ/候補 な/な すたいる/スタイル で/で けいたいそ/形態素 かいせき/解析 すみ/済 な/な げんご/言語 しげん/資源 を/を げんご/言語 もでる/モデル こうちく/構築 つーる/ツール を/を つかって/使って を/を つくる/作る ってのが/ってのが べすと/ベスト なんだよね/なんだよね その/その しゅほう/手法 を/を とらない/採らない とれない/採れない のは/のは たんじゅん/単純 に/に すとれーじ/ストレージ ようりょう/容量 の/の もんだい/問題
…って感じに文章が膨れ上がる(句読点及び英数は除いてます)。