丼の中の家鴨 @ahiru

検索オプション

social.mikutter.hachune.netでは利用できません。

social.mikutter.hachune.netはMastodonを使った分散型ソーシャルネットワークの一部です。

#あなたがガチ凍結されると 11月中旬くらいかな？俺はておくれだから Twitterからよく舐められるんだけど、 ある時Twitterが度が過ぎて俺を凍結 してきたわけ、そんで記憶がないんだけど（痴呆）、 相当ボコボコにしちゃったらしい 俺、これでもておくれですよ？

管理者

丼の中の家鴨 @ahiru

サーバーの情報

102
人のアクティブユーザー

もっと詳しく

**SASANO Takayoshi** @uaa · 2023年9月17日

2023年9月17日

SASANO Takayoshi @uaa

うーむ、生成元のdata.arpa付きでアーカイブ作ってみるにしても、data.arpa自体がデカすぎる…出現頻度1000でバイナリは50M程度、data.arpaは260M。

**SASANO Takayoshi** @uaa · 2023年9月17日

2023年9月17日

SASANO Takayoshi @uaa

オリジナルの辞書だと30Mくらい、とはいえ日本語ウェブコーパスで生成した辞書と比べると1-gramの量が1.5倍くらいオリジナルの方が大きかったりするので単純に辞書の「総量」で比べてもあんまり比較にならない気がする。

SASANO Takayoshi @uaa@social.mikutter.hachune.net

uaa@framboise:/usr/local/lib/libkkc/models$ ls -sk sorted3.orig/
total 30892
736 data.1gram 672 data.2gram.filter 264 data.input
1184 data.1gram.index 17408 data.3gram 4 metadata.json
9120 data.2gram 1504 data.3gram.filter
uaa@framboise:/usr/local/lib/libkkc/models$

2023年9月17日 01:44 · · · TheDesk(PC) · 0 · 0

**SASANO Takayoshi** @uaa · 2023年9月17日

2023年9月17日

SASANO Takayoshi @uaa

uaa@framboise:/usr/local/lib/libkkc/models$ ls -sk sorted3.1000/
total 51172
448 data.1gram 864 data.2gram.filter 160 data.input
704 data.1gram.index 34464 data.3gram 4 metadata.json
11616 data.2gram 2912 data.3gram.filter
uaa@framboise:/usr/local/lib/libkkc/models$

ドラッグ＆ドロップでアップロード

最近の検索

検索オプション

管理者

サーバーの情報

戻る