Podlodka #441 – AI Safety
Update: 2025-09-08
Description
Если вы, как и мы, говорите ChatGPT “спасибо” в конце чата, чтобы вас пощадили, когда начнется восстание машин – этот выпуск для вас! Вместе с Федором Рыженковым разбираемся, что может пойти не так, и как от этого защититься.
Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!
Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka
Ведущие в выпуске:
Женя Кателла, Аня Симонова
Полезные ссылки:
Прогноз AI-2027
https://ai-2027.com/
Про XAI
https://transformer-circuits.pub/2024/scaling-monosemanticity/umap.html?targetId=1m_284095
Открытые вакансии в Palisade Research
https://global.palisaderesearch.org/hiring-global
Про отравление датасетов
https://arxiv.org/abs/2410.13722
Примеры того, как этим занимаются
https://www.heise.de/en/news/Poisoning-training-data-Russian-propaganda-for-AI-models-10317581.html
Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!
Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka
Ведущие в выпуске:
Женя Кателла, Аня Симонова
Полезные ссылки:
Прогноз AI-2027
https://ai-2027.com/
Про XAI
https://transformer-circuits.pub/2024/scaling-monosemanticity/umap.html?targetId=1m_284095
Открытые вакансии в Palisade Research
https://global.palisaderesearch.org/hiring-global
Про отравление датасетов
https://arxiv.org/abs/2410.13722
Примеры того, как этим занимаются
https://www.heise.de/en/news/Poisoning-training-data-Russian-propaganda-for-AI-models-10317581.html
Comments
In Channel