Методологія синтезу мовлення з використанням технології нейронних мереж

dc.contributor.authorЄфремов Андрій Валерійович
dc.contributor.authorПротас, Надія Михайлівна
dc.date.issued2025
dc.descriptionЄфремов А.В. Методологія синтезу мовлення з використанням технології нейронних мереж : кваліфікаційна робота на здобуття ступеня вищої освіти Магістр за ОПП Інформаційні управляючі системи та технології 126 Інформаційні системи та технології. Полтава: Полтавський державний аграрний університет. 2025. 79 с.
dc.description.abstractРобота присвячена проблематиці побудови сучасних систем синтезу мовлення на основі нейронних мереж. Досліджено теоретичні та прикладні аспекти процесу синтезу мовлення, проаналізовано еволюцію методів від конкатенативних і формантних підходів до глибоких нейромережевих моделей. Визначено вимоги до лінгвістичного препроцесингу, акустичної репрезентації та вокодерів, що забезпечують високу якість, масштабованість і керованість синтезованого мовлення. У першому розділі виконано огляд принципів синтезу мовлення, класифіковано сучасні підходи та розглянуто нейромережеві архітектури Tacotron, FastSpeech, VITS, а також вокодери WaveNet і HiFi-GAN. Показано, як вибір архітектури впливає на природність звучання, швидкодію та стабільність системи. У другому розділі розроблено архітектуру системи синтезу мовлення з використанням глибоких нейронних мереж, описано підготовку корпусу, процедури навчання, механізм переозвучення аудіофайлів та засоби керування голосовими характеристиками. Третій розділ присвячено експериментальній перевірці запропонованої методології, оцінюванню якості синтезованого мовлення за суб’єктивними та об’єктивними метриками та техніко-економічному обґрунтуванню впровадження системи у практичні інформаційні сервіси. Робота має значення для розроблення голосових інтерфейсів, мультимедійних і освітніх платформ, інклюзивних технологій та інших систем, де потрібне автоматичне генерування природного мовлення. Запропоновані підходи можуть бути використані для подальшої оптимізації архітектур нейромережевого синтезу мовлення, підвищення якості звуку та розширення можливостей персоналізації голосу.
dc.identifier.citationЄфремов А.В. Методологія синтезу мовлення з використанням технології нейронних мереж : кваліфікаційна робота на здобуття ступеня вищої освіти Магістр за ОПП Інформаційні управляючі системи та технології 126 Інформаційні системи та технології. Полтава: Полтавський державний аграрний університет. 2025. 79 с.
dc.identifier.urihttps://dspace.pdau.edu.ua/handle/123456789/20954
dc.language.isouk
dc.publisherПолтавський державний аграрний університет (ПДАУ)
dc.subjectсинтез мовлення
dc.subjectнейронні мережі
dc.subjectTacotron
dc.subjectFastSpeech
dc.subjectVITS
dc.subjectWaveNet
dc.subjectHiFi-GAN
dc.subjectвокодер
dc.titleМетодологія синтезу мовлення з використанням технології нейронних мереж
dc.typeOther
Файли
Контейнер файлів
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
05-Єфремов АВ маг.pdf
Розмір:
1.37 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
17.09 KB
Формат:
Item-specific license agreed upon to submission
Опис: