Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://eir.kntu.net.ua/jspui/handle/123456789/2425
Назва: Дослідження можливостей використання LLM у розробці гібридного голосового асистента
Автори: Коберник, Д. С.
Ключові слова: Великі мовні моделі
гібридний голосовий асистент
обробка мовлення
штучний інтелект
NLP
розпізнавання голосу
синтез мовлення
Python
діалогові системи
Дата публікації: 2025
Видавництво: ХНТУ
Бібліографічний опис: Коберник, Д. С. Дослідження можливостей використання LLM у розробці гібридного голосового асистента : кваліфікаційна робота на здобуття ступеня вищої освіти «магістр» / Д. С. Коберник ; наук. керівник канд. техн. наук, доц. О. Є. Огнєва. ‒ Хмельницький : ХНТУ, 2025. – 99 с.
Короткий огляд (реферат): У першому розділі виконано дослідження еволюції голосових асистентів, розглянуто сучасні технології розпізнавання та генерації мовлення, проаналізовано їхні сильні та слабкі сторони. Подано огляд популярних систем, таких як Siri, Alexa, Google Assistant і Cortana, а також визначено обмеження, що існують у сфері контекстності, приватності та багатомовної підтримки. У другому розділі визначено актуальність розв’язуваної задачі, окреслено ключові вимоги до гібридної системи голосової взаємодії, сформульовано обмеження щодо апаратних можливостей, швидкодії та мережевих затримок. Обґрунтовано необхідність поєднання локальних і хмарних механізмів обробки для підвищення ефективності роботи. Третій розділ описує принципи використання алгоритмів розпізнавання мовлення, моделі VAD, механізми визначення ключового слова, методи інтеграції з LLM, а також обґрунтовано вибір інструментів Python та відповідних бібліотек. Наведено логічну схему побудови гібридної архітектури. Реалізацію прототипу гібридного голосового асистента подано в четвертому розділі, описано роботу ключових модулів (AudioManager, HybridRecognizer, WakeWordListener, логіку команд та інтеграцію з LLM). Окремо наведено результати тестування, включно з оцінкою WER, latency та стійкості до шумів. П’ятий розділ містить узагальнення характеристик системи, опис сценаріїв її використання, виявлені переваги та перспективи вдосконалення. Продемонстровано роботу асистента в реальних умовах, наведено приклади журналів тестування та сформульовано напрями подальшого розвитку гібридних голосових систем.
URI (Уніфікований ідентифікатор ресурсу): http://eir.kntu.net.ua/jspui/handle/123456789/2425
Розташовується у зібраннях:Спеціальність 121 - Інженерія програмного забезпечення



Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.