Podlodka #441 – AI Safety

Update: 2025-09-08

Description

Если вы, как и мы, говорите ChatGPT “спасибо” в конце чата, чтобы вас пощадили, когда начнется восстание машин – этот выпуск для вас! Вместе с Федором Рыженковым разбираемся, что может пойти не так, и как от этого защититься.

Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! 
Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka

Ведущие в выпуске:
Женя Кателла, Аня Симонова

Полезные ссылки:

Прогноз AI-2027
https://ai-2027.com/

Про XAI
https://transformer-circuits.pub/2024/scaling-monosemanticity/umap.html?targetId=1m_284095

Открытые вакансии в Palisade Research
https://global.palisaderesearch.org/hiring-global

Про отравление датасетов
https://arxiv.org/abs/2410.13722

Примеры того, как этим занимаются
https://www.heise.de/en/news/Poisoning-training-data-Russian-propaganda-for-AI-models-10317581.html