コントロールされたコーパスを使ってLLMを作り、その内部状態を分析することでLLMの「認知」の構造を調べる研究の紹介。一度言ったことを撤回する [BACK] トークンを導入すると推論がちょっと賢くなるという話が特に面白かった。
言語モデルの物理学 - ジョイジョイジョイ https://joisino.hatenablog.com/entry/physics
アカウントがあればユーザーやハッシュタグをフォローしたり、投稿のお気に入り登録やブースト、投稿への返信ができます。別のサーバーのユーザーとの交流も可能です。