
() 今回のテーマ「AIをどうやって制御するのか」

() 今回の参考文献『The Urgency of Interpretability』

() AIはブラックボックスである

() 「AIの内部構造の解明」で解決する3つの問題

() モデル解明(Model Interpretability)研究の今

() Superalignmentの手法: AIモデルの脳スキャン

() 我々人類のやるべきこと - 1.AI安全性研究にもっと取り組む

() 我々人類のやるべきこと - 2.AI安全性についてのルールを作る

() 我々人類のやるべきこと - 3.AI開発においてアメリカのリードを広げる

() 我々人類のやるべきこと - まとめ

() まとめ
