DiscoverЛингвоподкаст
Claim Ownership
Лингвоподкаст
Author: Мария Бочарова
Subscribed: 16Played: 117Subscribe
Share
2024 © Мария Бочарова. Все права защищены.
Description
Подкаст о языковых технологиях и лингвистические исследованиях. Обсуждаем с гостями из академии и индустрии исследования, работу в IT и академическую карьеру.
📍 Мы в telegram: https://t.me/lingvo_podcast
📍 Мы в Vk: https://vk.com/lingvopodcast
📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Проект реализуется совместно с НИУ ВШЭ.
16 Episodes
Reverse
Гость этого выпуска – Александр Антонов, аналитик в Яндекс.Переводчике и создатель корпусов для чувашского языка [https://huggingface.co/alexantonov]. С Александром мы обсудили механизмы автоматического перевода и специфику работы с малоресурсными языками. А еще поговорили:📍 Об истории развития моделей машинного перевода: от словарей и статистических моделей до нейронок и LLM📍 Об автоматической обработке малоресурсных языков: где берутся данные для обучения моделей и как создаются параллельные корпуса📍 Как разработчики учат модели учитывать контекст, интерпретировать метафоры и идиомы Ведущая, продюсер: Мария БочароваМонтажер: Андрей Чиркин🎧 Подписывайтесь на нас в соц. сетях: t.me/lingvo_podcastvk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.comТаймкоды:01:20 Как все начиналось: Манхэттанский проект и правиловые переводчики04:05 Первые модели статистического перевода07:50 Как нейросети поменяли правила игры10:50 Как работает перевод для разных грамматических систем12:40 Перспективы использования больших языковых моделей15:50 Как собираются параллельные корпуса20:10 Как оценивать модели перевода: бенчмарки, эталонные корпуса, нейросетевые метрики, люди25:25 Путь Александра в Яндекс и автоматический перевод27:40 Чувашско-русский переводчик, над которым работал Александр33:25 Зачем большому бизнесу перевод для малых языков35:00 Какие были сложности при сборе данных для чувашского языка36:40 Лайфхаки по обучению моделей для малых языков40:10 Перспективы корпуса чувашского языка: распознавание и генерация речи43:05 Достигли ли своего предела технологии перевода? Технологии speech-to-speech, мультимодальные GPT, перевод по фото, локализация.
Как современные технологии делают доступнее мир для слабослышащих людей? 🫰🏻 В новом выпуске подкаста мы встретились с Лизой Петровой — Computer Vision инженером из SberDevices. Лиза и ее команда занимаются задачами, связанными с компьютерным зрением и автоматической обработкой жестовых языков. Выпуск получился очень интересным! Мы обсудили:📍Как собирались и готовились данные для самого большого датасета для распознавания РЖЯ📍Важно ли разработчикам знать жестовый язык, чтобы делать state-of-the-art модели📍Как команде удалось создать лучшую в мире модель по распознаванию американского жестового языкаВедущая, продюсер: Мария БочароваМонтажер: Андрей Чиркин🎧 Подписывайтесь на нас в соц. сетях: t.me/lingvo_podcastvk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.comТаймкоды:0:42 Путь Лизы в Data Science и карьера в SberDevice4:14 Проекты R&D команды SberDevices: HaGRID, Slovo, EasyPortrait. Что такое face parsing, матирование, гармонизация9:05 Инклюзия. Потребность в распознавании РЖЯ11:30 Корректные обращения к слабослыщащим12:46 Датасет Slovo – как он создавался и какие были проблемы22:12 Изучение РЖЯ раКак современные технологии делают доступнее мир для слабослышащих людей? 🫰🏻24:45 Лучшая в мире модель по распознаванию американского жестокого языка SignFlow27:12 Как ML-модели работают с видео30:48 План развития: непрерывная речь, перевод, контекст33:43 Первый в мире открытый датасет РЖЯ и аналоги в других стран35:56 Результаты обучения модели37:29 Потенциал продукта39:29 Будущее сурдопереводчиков40:00 Мотивация работать в индустрии
Гостья этого выпуска – Марина Жукова – выпускница ФиКЛ ВШЭ, PhD-студентка в University of California, Santa Barbara и стажер в Amazon в команде разговорного бота Alexa. В этом эпизоде подкаста мы обсуждаем учебу на PhD, работу в большой корпорации и как это вообще можно совмещать.А еще:📍Как сразу после бакалавриата поступить на PhD в Америку📍Как пройти на стажировку в Amazon📍Чем работа в академии отличается от карьеры в индустрии📍Кто такой Knowledge-engineer и как он помогает улучшать работу голосовых помощниковВедущая, продюсер: Мария БочароваМонтажер: Андрей Чиркин🎧 Подписывайтесь на нас в соц. сетях: t.me/lingvo_podcastvk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.comТаймкоды:01:10 Путь Марины в лингвистике и учеба в Вышке04:00 Поездка во Францию по обмену и первые публикации04:30 Учеба в летних школах в Европе: Нидерланды, Чехия, Англия и Франция05:40 PhD сразу после бакалавриата и оффер в Университет Калифорнии в Санта-Барбаре07:30 Магистратура vs. PhD с точки зрения финансов08:35 "Стипендия на PhD в течение 5 лет на уровне прожиточного минимума"09:45 Процесс подачи заявки на PhD и особенность учебы22:03 Какие исследования Марина проводит в рамках PhD27:25 Собеседование в Amazon31:00 Чем занимается knowledge-engineer в команде голосового помощника Amazon37:00 Победа в соревновании Alexa Prize (Amazon) по созданию чат-бота43:35 Research в академии vs. research в индустрии vs. продуктовая команда50:05 Карьерные планы Марины50:30 Менторская программа от Google
Вместе с Марией Тихоновой – Senior Data Scientist'ом из SberDevices – обсудили, как работают большие языковые модели и как поменялись тренды в NLP с выходом ChatGPT, а еще:• В чем особенность R&D команд и над какими интересными проектами работают в SberDevices;• Как обучаются и оцениваются большие языковые модели (LLM)?• В чем особенность ChatGPT и как после его выхода изменились тренды в Natural Language Processing?Ведущая: Мария БочароваМонтажер: Андрей ЧиркинРедактор: Вероника Артибякина🎧 Подписывайтесь на нас в соц. сетях: t.me/lingvo_podcastvk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.comТаймкоды:0:40 Путь Маши в Data Science: мехмат МГУ, ШАД, Сбер4:20 В чем особенность R&D команд?7:28 Что драйвит Машу в ее работе?9:38 Как параллельно работать, преподавать и писать диссертацию?13:43 Что такое языковая модель?17:33 Как обучаются мультиязычные модели?18:40 В чем особенность ChatGPT?21:00 Как оценивать результаты работы языковой модели?24:44 Что такое бенчмарк25:44 Почему языковые модели могут проваливаться на дошкольных заданиях?28:22 Что такое AGI?34:31 Интересные проекты от SberDevices37:55 Про NLP конференции 41:38 Тренды NLP в 2024
В этом выпуске вместе с Даримой Мылзеновой (ML-инженер, Rask AI) и Юлей Коротковой (Text-to-Speech инженер, Rask AI; ex Just AI) обсуждаем, как компьютеры учатся говорить по-человечески. • Как работает технология преобразования аудио в текст и что такое липсинк. • Как технологии синтеза речи используются в индустрии: от озвучки аудио-книг до голосовых ассистентов. • С какими проблемами сталкиваются text-to-speech инженеры и почему Алиса не очень хорошо воспроизводит аббревиатурыВедущая: Мария БочароваМонтажер: Андрей ЧиркинРедактор: Татьяна Еремичева🎧 Подписывайтесь на нас в соц. сетях: t.me/lingvo_podcastvk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
В пилотном эпизоде 2 сезона мы встретились с Татьяной Еремичевой – стажером-исследователем Центра языка и мозга Высшей школы экономики – и обсудили психо- и нейролингвистический исследования:• Как психолингвисты помогают выявлять речевые нарушения и разрабатывают методы реабилитации• Что влияет на успешность освоения навыка чтения у детей и как работает "батарея" тестов• Как проводятся эксперименты и собираются данные в Центре языка и мозгаВедущая: Мария БочароваМонтажер: Андрей ЧиркинРедактор: Татьяна Еремичева🎧 Подписывайтесь на нас в соц. сетях: vk.com/lingvopodcastt.me/lingvo_podcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Сначала вы долго думаете, что вам будет интересно изучать в бакалавриате, а потом нужно делать еще более сложный выбор: определяться, в какой университет подавать документы. Мы вам сегодня поможем и расскажем о лингвистических программах в трех топовых университетах: Вышке, МГУ и РГГУ. Многие преподаватели Вышки выпустились из МГУ — значит ли это, что программы ничем не отличаются? А, может быть, наоборот? Мы пригласили Диану Врубель (из МГУ) и Настю Российскую (из РГГУ), чтобы узнать, как живется лингвистам из других университетах. В этом выпуске:• какие у Вышки, МГУ и РГГУ фундаментальные различия: курсы по выбору, треки обучения, проекты, экспедиции и лаборатории;• правда ли, что в МГУ учатся одни олимпиадники, а в Вышке сложнее сдавать сессии;• где лучше преподают программирование и NLP;• куда лучше поступить тем, кто хочет заниматься нейролингвистикой;• в каких вузах больше возможностей для развития студентов в академической среде и поиска работы в индустрии;Ведущие подкаста: Маша Бочарова и Ксюша ДаниловаМонтажер: Дана ОспановаРедактор: Саша Кибатова🎧 Подписывайтесь на наш Вконтакте: vk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Компьютерная лингвистика – инновационное научное направление, а технологии Natural language processing (NLP) вносят революционные изменения в наши жизни. Удобные чат-боты и голосовые помощники, быстрая обработка документов и генерация текстов (ChatGPT) – эти и многие другие важные задачи решают компьютерные лингвисты. Специалистов в этой области обучают в Вышке. В этом выпуске вы узнаете:• какие задачи решают компьютерные лингвисты: чат-боты, обработка речи и многое другое;• куда лучше идти, если хочешь заниматься NLP: на ФКН или ФиКЛ;• как построен курс по компьютерной лингвистике в Вышке;• какие крутые проекты можно создавать уже в бакалавриате;• какие перспективы ждут выпускника компьютерного трека.Ведущие подкаста: Маша Бочарова и Ксюша ДаниловаМонтажер: Андрей ЧиркинРедактор: Саша Кибатова🎧 Подписывайтесь на наш Вконтакте: vk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Этот выпуск посвящён актуальной для многих проблеме: как найти работу, будучи студентом, и эффективно совмещать её с учебой. Вместе с Машей Долгодворовой, студенткой 4 курса ФиКЛа и сотрудницей МТС AI, расскажем вам:• реально ли совмещать работу и учёбу в Вышке и как написать идеальное резюме;• где лучше работать студенту: в корпорации или в стартапе, – и в чем между ними разница;• какие курсы ФиКЛа точно пригодятся на будущей работе;• и как попасть в МТС AI и чем там занимаются разработчики-лингвисты. Ведущие подкаста: Маша Бочарова и Ксюша ДаниловаМонтажер: Андрей ЧиркинРедактор: Саша Кибатова🎧 Подписывайтесь на наш Вконтакте: vk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Всё это время мы говорили о направлениях в лингвистике. Но что делать, если это не твоё? Решили разобраться с Женей Чугреевым, студентом 4 курса ФиКЛа и аналитиком в Управлении торгового финансирования в Сбере, и нашей ведущей Ксюшей Даниловой – бренд-маркетологом в Тинькофф.Мы обсудили:• реально ли за год уйти из лингвистики в другую сферу, и, если да, то как; • как выделиться среди кандидатов с профильным образованием, если ты гуманитарий; • чем ФиКЛ лучше других гуманитарных программ с точки зрения современного рынка труда; • и много других вопросов, касающихся смены деятельности. Ведущие подкаста: Маша Бочарова и Ксюша ДаниловаМонтажер: Дана ОспановаРедактор: Саша Кибатова🎧 Подписывайтесь на наш Вконтакте: vk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Скрэмблинг, формсем и синтаксическое кодирование... Нет, это не новые зумерские словечки, это мы прониклись встречей с нашей новой гостьей Таней Симоновой, потому что в новом выпуске «Лингвоподкаста» мы добираемся до сердцевины ФиКЛа и говорим о теоретическом треке! Итак, мы обсудим:• Зачем изучать человеческие языки, даже если на них разговаривает 100 человек;• Как проходит полевая работа и правда ли, что это самая интересная часть работы лингвиста;• Какие перспективы есть у фикловца, закончившего теортрекИ о многом другом! Ведущие подкаста:Маша Бочарова @soimmaryКсюша Данилова @kvdanilova🎧 Подписывайтесь на наш Вконтакте: vk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Казалось бы, что может быть общего у специалиста по берестяным грамотам и электрофизиолога? Наш ответ — образовательная программа! О самом новом, самом экспериментальном и, на наш взгляд, самом интригующем направлении ФиКЛа мы решили поговорить со студентками четвертого курса Яной Кокоревой и Ксюшей Севериной. В этом выпуске вы узнаете: • как проходят нейролингвистические эксперименты • не слишком ли сложно изучать биологическую сторону языка в бакалавриате • можно ли через три года обучения сделать научное открытие • и что делать, если нейротрек не твоя дорога Ведущие подкаста:Маша Бочарова @soimmaryКсюша Данилова @kvdanilova🎧 Подписывайтесь на наш Вконтакте: vk.com/lingvopodcast📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Один из самых животрепещущих вопросов сейчас — об учёбе за границей, поэтому ловите новый эпизод подкаста! У нас в гостях Леша Бакланов и Арина Размыслович, студенты 4 курса ФиКЛа. Ребята расскажут об учебе в Норвегии и США, а ведущая Маша поделиться своим опытом учебы в Италии 🇮🇹🇳🇴🇺🇸
Мы поговорили:
• о разнице в системах образования в трех странах;
• об особенностях курсов, которые брали ребята;
• об общих впечатлениях о жизни за границей.Ведущие подкаста:
Маша Бочарова @soimmary
Ксюша Данилова @kvdanilova
Подписывайтесь на наш Вконтакте: vk.com/lingvopodcast
Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Один из самых животрепещущих вопросов сейчас — об учёбе за границей, поэтому ловите новый эпизод подкаста! У нас в гостях Леша Бакланов и Арина Размыслович, студенты 4 курса ФиКЛа. Ребята расскажут об учебе в Норвегии и США, а ведущая Маша поделиться своим опытом учебы в Италии 🇮🇹🇳🇴🇺🇸
Мы поговорили:
• о том, как подавать заявку, и правда ли это головоломно;
• как проходит отбор и кому достаётся счастливый билет;
• как не потеряться в чужой среде и почувствовать себя как дома. Ведущие подкаста:Маша Бочарова @soimmaryКсюша Данилова @kvdanilovaПодписывайтесь на наш Вконтакте: vk.com/lingvopodcastВопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Что может быть более волнительным для абитуриента, чем сдача ЕГЭ? Наверное, только олимпиады. Поговорить об этом мы пригласили студентов третьего курса «Фундаментальной и компьютерной лингвистики» Арсения Анисимова и Катю Козлову – участников перечневых, всероссийских, международных олимпиад по лингвистике (и не только). В этом выпуске вы узнаете:• какие бывают олимпиады и как к ним подготовиться • почему русский язык на школьных уроках и на олимпиаде — не одно и то же • какие сложности ждут участников всероссийских и международных олимпиад • что происходит, когда олимпиадники попадают в университетВедущие подкаста:Маша Бочарова @soimmaryКсюша Данилова @kvdanilovaПодписывайтесь на наш Вконтакте: vk.com/lingvopodcastВопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Иняз, лингвистика, филология… Может показаться, что между этими словами нет особенной разницы, но когда оказывается, что это не просто абстрактные термины, а образовательные программы, между которыми приходится выбирать абитуриенту, уже не до шуток.
Чтобы узнать, чем отличается внутренняя кухня трех образовательных программ Вышки, в первом выпуске «Лингвоподкаста» мы поговорили со студентками программ «Филология» и «Иностранные языки и межкультурная коммуникация» Кариной Поляковой и Марианной Ильенковой.
В этом выпуске вы узнаете:
• в чем главные отличия между филологом, лингвистом и межкультурным коммуникатором
• что изучают студенты этих программ и каков уровень преподавания иностранных языков
• к чему стоит морально готовиться абитуриенту
• в чем главная боль студентов с ИЯМКК, филологии и лингвистикиВедущие подкаста:Маша Бочарова @soimmaryКсюша Данилова @kvdanilovaПодписывайтесь на наш Вконтакте: vk.com/lingvopodcastВопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com
Comments
Top Podcasts
The Best New Comedy Podcast Right Now – June 2024The Best News Podcast Right Now – June 2024The Best New Business Podcast Right Now – June 2024The Best New Sports Podcast Right Now – June 2024The Best New True Crime Podcast Right Now – June 2024The Best New Joe Rogan Experience Podcast Right Now – June 20The Best New Dan Bongino Show Podcast Right Now – June 20The Best New Mark Levin Podcast – June 2024
United States