Back to people
まむ@mamurai1208
Recent posts
Swallow Leaderbord v2で評価したモデルの中で顕著だったのがGemma 4 31Bです。多くのベンチマークタスクでトップクラスの性能で、フロンティアモデルに匹敵します。JamC-QAや機械翻訳の性能の高さから、日本語にも強いモデルと言えます。 詳細な結果はこちら: https://swallow-llm.github.io/leaderboard/task-post.ja.html?category=post-sota

Swallow Leaderboard v2をアップデートしました。 GPT-5.4, Qwen 3.5, Gemma 4, llm-jp-4などのLLMを追加 推論型モデルの評価で確率的デコーディングを採用 MT-Benchの自動採点モデルをGPT-5.2(推論off)に変更 表の列見出しをクリックしてソートできるようにした https://swallow-llm.github.io/leaderboard/index-post.ja.html
PLaMo 3.0 Prime Betaの開発に関する貴重なお話を、東京科学大学でのトークを通じてご共有いただき、ありがとうございました。Swallowの事後学習における取り組みや直面している課題、今後の展望に至るまで多くの点で共通しており、大変印象的でした。

ま
東京科学大学の岡崎研究室のセミナーのためスライドを作ったので公開しました https://speakerdeck.com/pfn/20260406_plamo_3_beta_posttrain_and_inference_opt

