DiscoverPodlodka PodcastPodlodka #441 – AI Safety
Podlodka #441 – AI Safety

Podlodka #441 – AI Safety

Update: 2025-09-08
Share

Description

Если вы, как и мы, говорите ChatGPT “спасибо” в конце чата, чтобы вас пощадили, когда начнется восстание машин – этот выпуск для вас! Вместе с Федором Рыженковым разбираемся, что может пойти не так, и как от этого защититься.


Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!

Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka

Ведущие в выпуске:
Женя Кателла, Аня Симонова

Полезные ссылки:

Прогноз AI-2027
https://ai-2027.com/

Про XAI
https://transformer-circuits.pub/2024/scaling-monosemanticity/umap.html?targetId=1m_284095

Открытые вакансии в Palisade Research
https://global.palisaderesearch.org/hiring-global

Про отравление датасетов
https://arxiv.org/abs/2410.13722

Примеры того, как этим занимаются
https://www.heise.de/en/news/Poisoning-training-data-Russian-propaganda-for-AI-models-10317581.html
Comments 
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

Podlodka #441 – AI Safety

Podlodka #441 – AI Safety

Егор Толстой, Стас Цыганов, Екатерина Петрова и Евгений Кателла