DiscoverPodlodka PodcastPodlodka #435 – Синтез речи
Podlodka #435 – Синтез речи

Podlodka #435 – Синтез речи

Update: 2025-07-28
Share

Description

Синтез речи давно вышел за рамки утилитарных задач и стал важной частью взаимодействия человека с технологией: от помощников до медиа и образовательных продуктов. В гости к нам пришел Сергей Дуканов, который разрабатывал голосовые ассистенты Маруси, Алисы и Олега, а сейчас – CTO в международном AI dubbing стартапе Dubformer. В этом выпуске мы прошлись по четырём поколениям TTS-систем: от простейшего склеивания фрагментов до нейросетевых моделей, способных передавать интонации и эмоции. Обсуждаем, зачем синтезированной речи характер, почему интонационные “ошибки” делают голос живым и что важно учитывать при встраивании TTS в продукты.


Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях!

Telegram-чат: https://t.me/podlodka
Telegram-канал: https://t.me/podlodkanews
Страница в Facebook: www.facebook.com/podlodkacast/
Twitter-аккаунт: https://twitter.com/PodcastPodlodka

Ведущие в выпуске:
Стас Цыганов, Аня Симонова

Полезные ссылки:

TTS от Nari Labs – модель понимает семантику и воспроизводит non-verbal звуки https://file.notion.so/f/f/66aabc3d-2e89-493a-b4a0-fff5163ca3ce/d6943564-77a0-42bb-ab1b-9d8b069791b4/audio_(15).wav?table=block&id=1db3a738-1c3e-802c-aafe-d6c1f0a80cf4&spaceId=66aabc3d-2e89-493a-b4a0-fff5163ca3ce&expirationTimestamp=1752854400000&signature=whU8sG9EDBhx_rFMQCmV0HjWKBKx52kKz69bVVJqhRM

Больше примеров тут
https://yummy-fir-7a4.notion.site/dia

Примеры AI дубляжа от Dubformer: bobr curva на русском https://drive.google.com/file/d/1NT1kus-u7N67ThfAUFWfkggcCS_N2lvv/view?usp=sharing, TODO что-нибудь на английском
Comments 
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

Podlodka #435 – Синтез речи

Podlodka #435 – Синтез речи

Егор Толстой, Стас Цыганов, Екатерина Петрова и Евгений Кателла