【Apple最新論文】LLMは本当に「思考」しているのか?
Claude thinking、Gemini thinking、DeepSeek R1などに代表される推論型LLMの行う推論(reasoning)が、問題の複雑さに対してどのような振る舞いをするか調査した論文を解説します。
📝 論文書誌情報:Shojaee, P., Mirzadeh, I., Alizadeh, K., Horton, M., Bengio, S., & Farajtabar, M. (2025). The illusion of thinking: Understanding the strengths and limitations of reasoning models via the lens of problem complexity. arXiv preprint arXiv:2506.06941.
🔗 論文リンク: https://www.arxiv.org/abs/2506.06941
🐦 X:https://x.com/_mathbullet
👨🏻🎓 アジェンダ
・背景|推論モデル
・提題|推論モデルは汎用的な思考をしているのか?
・実験|複雑さを制御可能なパズルゲーム
・議論|推論モデルの強みと限界
---
「数理の弾丸」は、人工知能や言語にまつわる学術知をわかりやすく、誤魔化さずに伝えることを目指すチャンネルです。
■スピーカー:吉田、スミス、鈴木
2025年06月13日