標本分散: "コントロールされたコーパスを使ってLLMを作り、その内部状態…" - mikutter

最近の検索

検索オプション

social.mikutter.hachune.netでは利用できません。

social.mikutter.hachune.netはMastodonを使った分散型ソーシャルネットワークの一部です。

#あなたがガチ凍結されると<br> 11月中旬くらいかな？俺はておくれだから<br> Twitterからよく舐められるんだけど、<br> ある時Twitterが度が過ぎて俺を凍結<br> してきたわけ、そんで記憶がないんだけど（痴呆）、<br> 相当ボコボコにしちゃったらしい<br> 俺、これでもておくれですよ？

管理者

丼の中の家鴨 @ahiru

サーバーの情報

102
人のアクティブユーザー

もっと詳しく

標本分散 @osa_k@social.mikutter.hachune.net

コントロールされたコーパスを使ってLLMを作り、その内部状態を分析することでLLMの「認知」の構造を調べる研究の紹介。一度言ったことを撤回する [BACK] トークンを導入すると推論がちょっと賢くなるという話が特に面白かった。

言語モデルの物理学 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ https://joisino.hatenablog.com/entry/physics

言語モデルの物理学 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

ｼﾞｮｲｼﾞｮｲｼﾞｮｲ · 3月24日言語モデルの物理学 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ言語モデルの物理学 (Physics of Language Models) とは、FAIR (Meta) の Zeyuan Allen-Zhu が提唱した、言語モデルの研究を進めるためのコンセプトです。ざっくり言うと、「あのモデルはこう」とか「そのモデルはこのモデルよりもこう」というような博物学的な知識を深めるのではなく、17世紀にケプラーやニュートンが物理学において行ったような原理に基づいた研究を進め、「言語モデルはなぜこのような振る舞いをするのか」という問いに答えられるようになるべきという考え方です。言語モデルの物理学の特徴は大きく2つあります。第一は、ウェブから収集したコーパスを使…

2025年3月29日 10:30 · · 6 · 8

ドラッグ＆ドロップでアップロード