() モデル解明(Model Interpretability)研究の今(00:04:15 - 00:09:39) - AIは制御できるのか?【The Urgency of Interpretability】

() モデル解明(Model Interpretability)研究の今(00:04:15 - 00:09:39)
AIは制御できるのか?【The Urgency of Interpretability】

今回はAnthropic CEOのDario Amodeiが書いた『The Urgency of Interpretability』について話しました。

続きの動画: https://youtu.be/ASR4qo2vzi0

【目次】
(00:00) 今回のテーマ「AIをどうやって制御するのか」
(00:21) 今回の参考文献『The Urgency of Interpretability』
(00:41) AIはブラックボックスである
(02:...
今回はAnthropic CEOのDario Amodeiが書いた『The Urgency of Interpretability』について話しました。

続きの動画: https://youtu.be/ASR4qo2vzi0

【目次】
(00:00) 今回のテーマ「AIをどうやって制御するのか」
(00:21) 今回の参考文献『The Urgency of Interpretability』
(00:41) AIはブラックボックスである
(02:18) 「AIの内部構造の解明」で解決する3つの問題
(04:15) モデル解明(Model Interpretability)研究の今
(09:39) Superalignmentの手法: AIモデルの脳スキャン
(14:00) 我々人類のやるべきこと - 1.AI安全性研究にもっと取り組む
(16:06) 我々人類のやるべきこと - 2.AI安全性についてのルールを作る
(16:42) 我々人類のやるべきこと - 3.AI開発においてアメリカのリードを広げる
(18:43) 我々人類のやるべきこと - まとめ
(19:02) まとめ
(19:51) AnthropicのAlignment研究

【参考文献】
- https://www.darioamodei.com/post/the-urgency-of-interpretability
- https://openai.com/index/language-models-can-explain-neurons-in-language-models/
- https://transformer-circuits.pub/2025/attribution-graphs/biology.html
- https://www.anthropic.com/research/exploring-model-welfare
- https://youtu.be/pyXouxa0WnY?si=19FEKkB4Nt-MNS1U
- https://techstartups.com/2025/04/18/anthropic-backs-goodfire-in-50m-series-a-to-decode-ai-models-marking-first-ever-startup-investment/

【起業の履歴書について】
起業の履歴書は「偉大な企業を作り上げた起業家やその企業の歴史や哲学 📚」を掘り下げたり「スタートアップのテクノロジートレンド 💻」について話すチャンネルです!

<ホスト>
・East Ventures 村上雄也 -
・伊藤工太郎 -

<Podcast>
Spotify - https://open.spotify.com/show/5ryodBEEOn66Wk7H2Sl8zF
Apple - https://podcasts.apple.com/jp/podcast/kigyo-no-rirekisho/id1767313170

【お問い合わせ】
起業の相談やお仕事の依頼は「下記お問い合わせフォーム 📋」または「上記XアカウントのDM 📮」にお送りください!

https://forms.gle/hYZojSEgvqis8Pys5

取り扱って欲しいテーマのリクエストなどもお待ちしております!
() 今回のテーマ「AIをどうやって制御するのか」 - AIは制御できるのか?【The Urgency of Interpretability】

() 今回のテーマ「AIをどうやって制御するのか」

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:00:00 - 00:00:21
() 今回の参考文献『The Urgency of Interpretability』 - AIは制御できるのか?【The Urgency of Interpretability】

() 今回の参考文献『The Urgency of Interpretability』

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:00:21 - 00:00:41
() AIはブラックボックスである - AIは制御できるのか?【The Urgency of Interpretability】

() AIはブラックボックスである

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:00:41 - 00:02:18
() 「AIの内部構造の解明」で解決する3つの問題 - AIは制御できるのか?【The Urgency of Interpretability】

() 「AIの内部構造の解明」で解決する3つの問題

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:02:18 - 00:04:15
() モデル解明(Model Interpretability)研究の今 - AIは制御できるのか?【The Urgency of Interpretability】

() モデル解明(Model Interpretability)研究の今

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:04:15 - 00:09:39
() Superalignmentの手法: AIモデルの脳スキャン - AIは制御できるのか?【The Urgency of Interpretability】

() Superalignmentの手法: AIモデルの脳スキャン

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:09:39 - 00:14:00
() 我々人類のやるべきこと - 1.AI安全性研究にもっと取り組む - AIは制御できるのか?【The Urgency of Interpretability】

() 我々人類のやるべきこと - 1.AI安全性研究にもっと取り組む

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:14:00 - 00:16:06
() 我々人類のやるべきこと - 2.AI安全性についてのルールを作る - AIは制御できるのか?【The Urgency of Interpretability】

() 我々人類のやるべきこと - 2.AI安全性についてのルールを作る

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:16:06 - 00:16:42
() 我々人類のやるべきこと - 3.AI開発においてアメリカのリードを広げる - AIは制御できるのか?【The Urgency of Interpretability】

() 我々人類のやるべきこと - 3.AI開発においてアメリカのリードを広げる

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:16:42 - 00:18:43
() 我々人類のやるべきこと - まとめ - AIは制御できるのか?【The Urgency of Interpretability】

() 我々人類のやるべきこと - まとめ

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:18:43 - 00:19:02
() まとめ - AIは制御できるのか?【The Urgency of Interpretability】

() まとめ

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:19:02 - 00:19:51
() AnthropicのAlignment研究 - AIは制御できるのか?【The Urgency of Interpretability】

() AnthropicのAlignment研究

AIは制御できるのか?【The Urgency of Interpretability】
2025年05月07日 
00:19:51 - 00:20:16

起業の履歴書

※本サイトに掲載されているチャンネル情報や動画情報はYouTube公式のAPIを使って取得・表示しています。動画はYouTube公式の動画プレイヤーで再生されるため、再生数・収益などはすべて元動画に還元されます。

Timetable

動画タイムテーブル

タイムテーブルが見つかりませんでした。