DiscoverДеньги любят техно
Claim Ownership
Деньги любят техно
Author: VTB Bank
Subscribed: 105Played: 953Subscribe
Share
2024 © VTB Bank. Все права защищены.
Description
Пока весь мир ждет революции в развитии искусственного интеллекта, мы говорим с теми, кто его создает. Новые сезоны подкаста «Деньги любят техно» посвящены науке о данных, машинному обучению, дата-инженерии и всему, что с этим связано. Говорим с экспертами из науки, исследователями и практиками из компаний различных отраслей – про развитие ML, данные, дата-аналитику и влияние технологий, которые принято называть «искусственным интеллектом», на бизнес.
31 Episodes
Reverse
Работа Data Science-специалистов в промышленных компаниях строится по своим правилам и требует специфических навыков: нужно не только любить математику, но и дружить с физикой, и разбираться в технологии. Кроме того, работа DS-команд вплотную связана с людьми и процессами на производстве. Есть и особенности в работе с данными: всевозможные промышленные агрегаты оставляют огромный цифровой след в системах, и тем самым создают почву для внедрения ИИ-продуктов. При этом «все, что можно сделать без искусственного интеллекта, надо делать без искусственного интеллекта», – уверен гость выпуска, директор департамента технологий ИИ «Русала» Михаил Граденко.
Ищем сходства и различия в задачах DS-команд в финтехе и промышленности, обсуждаем проблемы и решения, выделяем главные направления развития ML в этих сферах.
Ведущие выпуска: Юлий Шамаев, начальник управления моделирования партнерств и ИТ-процессов ВТБ, и Марина Эфендиева, технологический обозреватель.
Подкаст доступен в видео-версии на платформе VK Видео и на всех популярных аудио-платформах. Подпишитесь, чтобы поддержать нас и не пропустить новые эпизоды сезона Data Science.
Использовать машинное обучение везде, где это возможно и целесообразно — и в пользовательских сервисах, и во внутренних процессах. Такую парадигму развития ML в компании озвучил Андрей Рыбинцев, старший директор по данным и аналитике «Авито». Обсудили, с чего начинается путь в Data Science, какие задачи кажутся самыми интересными и в каких процессах без ML уже не обойтись – а также то, как из гипотезы рождается продукт и какие «созидательные кейсы», позволяющие улучшить клиентский опыт, особенно важны IT-компаниям.
Ведущие эпизода: Юлий Шамаев, начальник управления моделирования партнерств и ИТ-процессов ВТБ, и Марина Эфендиева, технологический обозреватель.
Этот выпуск — «пилот» пятого сезона, который мы запускаем и в уже привычном формате аудио, и в новом для нашего подкаста формате видео. Слушайте и смотрите нас на удобных вам площадках и поддержите подкаст, если считаете, что он приносит пользу!
С командой дата-сайентистов из ВТБ подводим итоги 2023 года в темах развития нейросетей, машинного обучения, инструментов на базе ИИ. Конечно же говорим про большие языковые модели и начало гонки генеративного AI среди бигтехов. Делимся своим опытом использования нейросетей в работе и в жизни. Говорим об этике, философски обсуждаем настоящее и немного фантазируем о будущем. И пытаемся узнать, когда ИИ поработит человечество.
Участники:
• Антон Бабак, тимлид в команде перспективных алгоритмов машинного обучения
• Иван Яруков, Senior DS, моделирование в крупном бизнесе и СМБ
• Анатолий Глушенко, тимлид DS, моделирование партнерств и ИТ-процессов
Ведущая:
• Технологический обозреватель Марина Эфендиева
Подпишитесь, чтобы послушать другие эпизоды сезона Data Science в подкасте «Деньги любят техно».
Машинное обучение так или иначе уже применяется в компаниях самых разных масштабов и направлений деятельности. Однако для выстраивания зрелой ML-инфраструктуры и перехода к эффективным MLOps-практикам требуется понимание: с чего начать, на какие платформы обратить внимание, к каким инструментам присмотреться внимательнее, а какие подойдут лишь для разовых экспериментов.
К инструментам MLOps для больших исследовательских и бизнес-задач предъявляется три базовых требования: интерпретируемость, воспроизводимость, надёжность. Как среди десятков Open-Source-инструментов выбрать правильные, что могут или не могут использовать компании, к которым предъявляются высокие требования стандартизации, на чем должен основываться выбор между облаками и InHouse для ML — в третьем выпуске серии MLOps обсудили Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ.
Подпишитесь, чтобы не пропустить новые эпизоды сезона Data Science в подкасте «Деньги любят техно».
Дополнительные материалы:
Ссылки на полезные ресурсы к этому эпизоду ищите в нашем блоге на Хабр: https://habr.com/ru/companies/vtb/news/778270/
Во второй части большой темы про MLOps, которую мы разбили на несколько эпизодов подкаста, ещё глубже погружаемся в тему машинного обучения и работы с данными, лежащей в основе ML. Рассматриваем вопросы обогащения данных, разбираемся с разметкой, говорим о специфических аспектах управления данными.
В этом выпуске вы услышите:
Почему общепринятых стандартов управления данными недостаточно для работы с большими данными для ML;
Что такое хвосты и артефакты в сверхбольших данных;
Может ли overfeeding стать причиной overfitting’a (или это одно и то же?);
И многое другое!
Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, подошли к теме с двух сторон: теоретической и практической. Помогли ведущей подкаста разобраться с терминологией. А также поговорили про специфику подходов к образованию для специалистов в Data Science, DataOps и MLOps.
Полезные ресурсы и ссылки:
Курс MLOps (OTUS): https://otus.ru/lessons/ml-bigdata/
Основные идеи из книги «Сотрудничество в DevOps-культуре»: http://agilemindset.ru/основные-идеи-из-книги-сотрудничест/
MLOps: Continuous delivery and automation pipelines in machine learning: https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning
Как создавать качественные ML-системы. Часть 1: каждый проект должен начинаться с плана: https://habr.com/ru/companies/vk/articles/749850/
Как создавать качественные ML-системы. Часть 2: приручаем хаос: https://habr.com/ru/companies/vk/articles/749852/
The Data Engineering Cookbook: https://github.com/andkret/Cookbook
Стандарты:
ISO/IEC DIS 5259-1: https://www.iso.org/standard/81088.html
ISO/IEC DIS 5259-4: https://www.iso.org/standard/81093.html
ISO/IEC 8183:2023: https://www.iso.org/standard/83002.html
О нейронных сетях мы слышим сегодня буквально отовсюду. Это — одно из наиболее активно развивающихся направлений в машинном обучении. В новом выпуске подкаста «Деньги любят техно», сезон Data Science, пробуем зайти в тему нейросетей с необычного ракурса.
С Артемом Летиным, начальником управления корпоративного моделирования ВТБ, Евгением Смирновым, руководителем Лаборатории машинного обучения Альфа-Банка и Никитой Зелинским, руководителем центра компетенций Data Science МТС говорим о применении нейросетей в кредитном скоринге и других сегментах деятельности финансовых организаций.
В этом выпуске мы возвращаемся к теме MLOps — на этот раз с Алексеем Незнановым, к.т.н., старшим научным сотрудником международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, и Юрием Каревым, руководителем управления процессов и стандартов моделирования и машинного обучения ВТБ.
Начинаем с обсуждения самого понятия MLOps: что это — необходимые для большой компании практики или очередная хайповая тема? Как интегрировать MLOps в производственные IT процессы и зачем это делать? Насколько на развитие этого направления влияют вопросы управления данными, очистки данных, и решены ли они.
Спойлер: это первый выпуск на тему MLOps из запланированной серии. Подпишитесь, чтобы не пропустить продолжение.
Мы рады поделиться первым выпуском четвёртого сезона подкаста «Деньги любят техно» — и это уже второй сезон, посвящённый темам Data Science. Сразу же решили обсудить животрепещущую тему датасетов для искусственного интеллекта: их доступность, их источники, вопросы регулирования и востребованности рынком.
В этом выпуске — Алексей Каширин, директор Центра продвинутой аналитики Альфа-Банка и Сергей Голицын, вице-президент, заместитель руководителя Департамента анализа данных и моделирования ВТБ поговорили о применении датасетов в финтехе и других отраслях, поделились опытом работы своих команд, рассказали о самых заметных событиях и конкурсах в этой области.
С Кириллом Кулаковым, техническим консультантом «Лаборатории Касперского», и Лилией Шароватовой, начальником управления анализа и мониторинга операций ВТБ, обсуждаем привычные и совершенно новые уловки мошенников.
Звонят ли клиентам банки? Что делать, если вас по телефону пытаются уговорить перевести деньги на другой счет? Почему для сохранения денег от мошенников важны не только банковские технологии, но и финансовая грамотность клиентов — эксперты поделились мнениями и историями на эти темы.
Чем больше мы доверяем ИИ, тем чаще слышим о его ошибках и уязвимостях. Пробуем разобраться, какие с этим связаны риски сейчас и какие появятся в будущем. Почему многое зависит от входных данных на этапе обучения нейросети. И как часто в жизни встречаются адверсальные атаки.
Дмитрий Берестнев, лидер стрима разработки моделей для партнеров и Платформы больших данных ВТБ, поговорил об этом с Григорием Кабатянским, д. ф.-м.н., вице-президентом по академическому сотрудничеству Сколтеха, и Иваном Фурсовым, специалистом в области разговорного искусственного интеллекта. Получилась одна из самых жарких дискуссий в специальной DS-серии нашего подкаста.
Чаще, сильнее, продолжительнее. Этими тремя словами можно описать кибератаки, обрушившиеся в 2022 году на инфраструктуру российских компаний.
Подводим итоги уходящего года в области кибербезопасности вместе с Сергеем Безбоговым, старшим вице-президентом ВТБ, и Сергеем Головановым, главным экспертом «Лаборатории Касперского». Говорим о том, кого, как и откуда атаковали хакеры, как трансформировались старые угрозы и какие возникли новые, а также почему специалистам по ИБ не придется расслабляться в следующем году.
В России каждая четвертая компания использует технологии сбора и обработки больших данных, а в финансовой отрасли — почти каждая вторая компания. Обсуждаем тренды развития рынка данных: почему все чаще звучат идеи объединения данных из разных источников — естественно, безопасного и обезличенного. Нужно ли такое объединение данных бизнесу, и решения каких технологических задач оно потребует от дата-сайентистов.
В новом выпуске подкаста «Деньги любят техно» серии Data Science на эти темы потеоретизировали вице-президент, заместитель руководителя департамента анализа данных и моделирования ВТБ Сергей Голицын и директор по разработке RnD центра Big Data МТС Никита Зелинский.
Экспериментальный выпуск, который поможет эффективнее бороться с категоричностью и с крайностями в суждениях. Такого ещё никто не делал, а мы попробовали. В новом выпуске постарались выяснить, является ли профессия дата-сайентиста одной из древнейших.
В дискуссии приняли участие специалисты из самых разных областей:
Бронислав Виногродский, китаевед, писатель, переводчик основополагающих китайских текстов; Константин Воронцов, доктор физико-математических наук, профессор РАН, МГУ и МФТИ; Дмитрий Доронин, социальный антрополог, этнограф, научный сотрудник РГГУ и РАНХиГС; Наталия Пузырникова, заместитель председателя правления, руководитель службы управления рисками Газпромбанка; Денис Суржко, начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ. Ведёт дискуссию Вадим Кулик, заместитель президента-председателя правления ВТБ.
Для чего сегодня применяется MLOps и в каких задачах без него не обойтись завтра? Помогает ли MLOps бизнесу развивать Data Science или, может быть, мешает? В чём заключается роль специалиста по ML, и как специализации будут дробиться в будущем? В конце-концов, кто всем этим должен заниматься и где этому учат — обсуждаем с Юрием Каревым, руководителем управления процессов и стандартов моделирования и машинного обучения ВТБ, и Петром Ермаковым, ML Brand Director Яндекса.
Следующий год станет годом пробных проектов с цифровым рублём. Что это такое, как это будет работать, для чего его можно будет использовать? Цифровой рубль — это безопасно? И насколько это будет удобно?
Технологический обозреватель Марина Эфендиева и главный редактор ресурса финансовой грамотности «Мои финансы РФ» Надя Грошева расспросили о настоящем и будущем «третьей формы денег» Леонида Кожинского, начальника управления омниканальных микросервисных решений ВТБ.
Как необходимо развиваться сегодня, чтобы AutoML не заменил вас завтра?
О практической и философской стороне AutoML, изменениях в роли специалиста в Data Science, прошлом и будущем построения моделей и возможностях Искусственного интеллекта рассуждают профи — Денис Суржко, начальник управления перспективных алгоритмов машинного обучения ВТБ и Алексей Натёкин, диктатор ODS.
Александр Сахнов, руководитель отдела мультивариативного анализа X5 Group и Артём Летин, руководитель подразделения разработки моделей для корпоративного сегмента клиентов ВТБ обсудили метод А/В-тестирования для оценки изменений в бизнесе. Где, кроме маркетинга, применяются A/B-тесты, на какие этапы делится этот процесс и когда начинается работа дата сайентистов? Говорим в подкасте о подходах, плюсах и минусах проверок бизнес-идей и гипотез с помощью методик А/В-тестирования и возможностях автоматизации этого процесса.
Россия, год 2022. Из крупнейших магазинов приложений исчезают важные и нужные аппы. Это — ощутимая проблема и для пользователей, и для компаний. Операционный директор RuStore Илья Сверчков и управляющий директор цифрового бизнеса ВТБ Юрий Герасименко рассказали, через какие испытания пришлось пройти командам разработчиков, чтобы удаление приложений не ударило по пользователям. Обсудили, может ли веб стать полноценной заменой аппу, и насколько легко пользователи адаптируются к альтернативам.
Директор по стратегическому маркетингу «Яндекса» Андрей Себрант, руководитель департамента цифрового бизнеса ВТБ Никита Чугунов и технологический обозреватель Марина Эфендиева обсудили главные технологические тренды 2021 года.
Зелёная повестка, беспилотники, информационная безопасность, блокчейн и, конечно, метавселенная, о которой не хотелось говорить, но пришлось. Что было, что будет, чем сердце успокоится — слушайте в этом подкасте.
С наступающим 2022 годом, друзья! Пусть он будет к нам добрее, чем его предшественник.
В новом выпуске обсуждаем, как деятельность дата-сайентистов влияет на общество и жизнь людей в целом. Почему необходимо менять подходы к образованию специалистов по Data Science и что делать, чтобы человечество не вымерло. Рассказываем о новой магистерской программе «4 И» МФТИ и ВТБ — на стыке технологий искусственного интеллекта и реальных управленческих задач в современном социальном контексте.
Гости выпуска:
- Доктор физико-математических наук, профессор РАН, заведующий кафедрой машинного обучения и цифровой гуманитаристики МФТИ Константин Вячеславович Воронцов;
- Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ Денис Суржко.
Comments
Top Podcasts
The Best New Comedy Podcast Right Now – June 2024The Best News Podcast Right Now – June 2024The Best New Business Podcast Right Now – June 2024The Best New Sports Podcast Right Now – June 2024The Best New True Crime Podcast Right Now – June 2024The Best New Joe Rogan Experience Podcast Right Now – June 20The Best New Dan Bongino Show Podcast Right Now – June 20The Best New Mark Levin Podcast – June 2024
United States