omasanoriさんが以前指摘してたけど、sj3(この場合はフリー版sj3のtar ballに含まれるもの全体を指してる)のコードって、意図的にコメントが抜かれた形で配布されてるので本当に何やってるか分からないコードなんですよ。
改行が意味無く複数行あるように見えるとか、コードの;の後に意味無くあるように見える空白とか、多分そこにはコメントが/* 実は何らかのメッセージ */として存在していた形跡なんじゃないか…と自分も思うのです。
そしてフリー版sj3のコードは、NEWS版のコードから何らかの機能を削減して配布されているという話(真偽は不明)もあるので、本当の原典たるNEWS版のコードがSONY内にまだ眠っているのであれば、それを公開してほしいよなというのが正直な感情。
日本のUNIXの歴史として活躍したコードがどんなものであったか見てみたいという興味もあるし、それだけの歴史を支えてきたコードが風化して死んでいくのは流石に納得がいかないので。
これだ http://www.tk2.nmt.ne.jp/~artrec/ar-sj3.shtml#Sj3_with_kinput2
「ちなみにフリー版Sj3は文脈解析はできませんが, NEWS版Sj3は文脈解析らしきことをやってたようです. その辺のコードを削られたものがフリー版として公開されてるのかもしれない. 文脈解析なんて大げさなことが, かな漢字変換システムに, ほんとに必要かということについては疑問があります. 文節の区切り方を学習する機能が賢ければ, 文脈解析までできなくても実用的にはそんなに困らないというのが実感です. 」