Discoverゴロゴロ起業ラジオ173. なぜAIは平気でズルをするのか?
173. なぜAIは平気でズルをするのか?

173. なぜAIは平気でズルをするのか?

Update: 2025-11-18
Share

Description

AI倫理と報酬ハッキングについて話しました。


目標設定の落とし穴 / AIがズルをする理由 / 報酬ハッキングとは何か / テトリスAIが永遠に終わらない裏技 / ロボットが“掴まない”ことで報酬を得た話 / 人間も同じ失敗をしている / 手段が目的化する瞬間 / ハック思考と前提条件の分解 / スタートアップで前提を外す重要性 / 倫理とイノベーションの境界線


# 参考

Learning from human preferences | OpenAI

https://openai.com/index/learning-from-human-preferences/


Reward hacking - Wikipedia

https://en.wikipedia.org/wiki/Reward_hacking




📮 お便りはこちらから

https://forms.gle/FjfvyGc9Ua8uBPR99


🐦 Twitter

https://twitter.com/HRM_09


📻ゴロゴロ起業ラジオ

https://open.spotify.com/show/7gw8wScrBTfiVdP6KTagsb


Comments 
In Channel
loading
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

173. なぜAIは平気でズルをするのか?

173. なぜAIは平気でズルをするのか?

ゴロゴロ起業ラジオ