Дослідження глибокого навчання з підкріпленням у середовищі VizDoom

Вдовиченко, В. С.

Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://eir.kntu.net.ua/jspui/handle/123456789/2417

Назва:	Дослідження глибокого навчання з підкріпленням у середовищі VizDoom
Автори:	Вдовиченко, В. С.
Ключові слова:	Навчання з підкріпленням машинне навчання VIZDOOM
Дата публікації:	2025
Видавництво:	ХНТУ
Бібліографічний опис:	Вдовиченко, В. С. Дослідження глибокого навчання з підкріпленням у середовищі VizDoom : кваліфікаційна робота на здобуття ступеня вищої освіти «магістр» / В. С. Вдовиченко ; наук. керівник д-р техн. наук, проф. В. О. Доровський. ‒ Хмельницький : ХНТУ, 2025. – 91 с.
Короткий огляд (реферат):	У магістерській роботі досліджено методи глибокого навчання з підкріпленням у контексті середовища VizDoom, що є тривимірною платформою для моделювання агентів у шутері від першої особи. Основну увагу зосереджено на аналізі, розробці та експериментальному оцінюванні агентів, побудованих на базі алгоритму Deep Q-Network (DQN) та його покращених модифікацій. Розглянуто ключові компоненти DQN: нейронну апроксимацію Q-функції, використання цільової мережі, буфера досвіду та механізмів стабілізації навчання. У роботі детально вивчено вплив стекування кадрів, n-крокових повернень та пріоритетного повторного відтворення досвіду на швидкість збіжності та кінцеву ефективність агентів. Проведено систематичний аналіз простору станів і дій, параметрів середовища VizDoom, а також чинників, що визначають складність навчання в умовах часткової спостережуваності та високої динаміки. Запропоновано експериментальну методику, що включає порівняння базового DQN з його модифікаціями за метриками середньої та мінімальної винагороди, стабільності та варіативності. Отримані результати демонструють суттєве покращення ефективності агентів при використанні комбінації вдосконалень, зокрема n-крокових повернень і пріоритетного досвіду, що забезпечують швидшу адаптаціюдо складних сценаріїв VizDoom. Робота робить внесок у практичне застосування глибокого навчання з підкріпленням у 3D-середовищах та може бути використана як основа для подальших досліджень алгоритмів навчання з підкріпленням у високодинамічних задачах.
URI (Уніфікований ідентифікатор ресурсу):	http://eir.kntu.net.ua/jspui/handle/123456789/2417
Розташовується у зібраннях:	Спеціальність 121 - Інженерія програмного забезпечення

Файли цього матеріалу:

Файл	Опис	Розмір	Формат
Вдовиченко В. С. Дослідження глибокого навчання з підкріпленням у середовищі VizDoom.pdf		113.37 kB	Adobe PDF	Переглянути/Відкрити

Показати повний опис матеріалу Перегляд статистики

Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.

DSpace JSPUI

DSpace зберігає і дозволяє легкий і відкритий доступ до всіх видів цифрового контенту, включаючи текст, зображення, анімовані зображення, MPEG і набори даних