Дослідження глибокого навчання з підкріпленням у середовищі VizDoom

Вдовиченко, В. С.

Please use this identifier to cite or link to this item: http://eir.kntu.net.ua/jspui/handle/123456789/2417

Full metadata record

DC Field	Value	Language
dc.contributor.author	Вдовиченко, В. С.	-
dc.date.accessioned	2026-03-10T15:33:23Z	-
dc.date.available	2026-03-10T15:33:23Z	-
dc.date.issued	2025	-
dc.identifier.citation	Вдовиченко, В. С. Дослідження глибокого навчання з підкріпленням у середовищі VizDoom : кваліфікаційна робота на здобуття ступеня вищої освіти «магістр» / В. С. Вдовиченко ; наук. керівник д-р техн. наук, проф. В. О. Доровський. ‒ Хмельницький : ХНТУ, 2025. – 91 с.	uk_UA
dc.identifier.uri	http://eir.kntu.net.ua/jspui/handle/123456789/2417	-
dc.description.abstract	У магістерській роботі досліджено методи глибокого навчання з підкріпленням у контексті середовища VizDoom, що є тривимірною платформою для моделювання агентів у шутері від першої особи. Основну увагу зосереджено на аналізі, розробці та експериментальному оцінюванні агентів, побудованих на базі алгоритму Deep Q-Network (DQN) та його покращених модифікацій. Розглянуто ключові компоненти DQN: нейронну апроксимацію Q-функції, використання цільової мережі, буфера досвіду та механізмів стабілізації навчання. У роботі детально вивчено вплив стекування кадрів, n-крокових повернень та пріоритетного повторного відтворення досвіду на швидкість збіжності та кінцеву ефективність агентів. Проведено систематичний аналіз простору станів і дій, параметрів середовища VizDoom, а також чинників, що визначають складність навчання в умовах часткової спостережуваності та високої динаміки. Запропоновано експериментальну методику, що включає порівняння базового DQN з його модифікаціями за метриками середньої та мінімальної винагороди, стабільності та варіативності. Отримані результати демонструють суттєве покращення ефективності агентів при використанні комбінації вдосконалень, зокрема n-крокових повернень і пріоритетного досвіду, що забезпечують швидшу адаптаціюдо складних сценаріїв VizDoom. Робота робить внесок у практичне застосування глибокого навчання з підкріпленням у 3D-середовищах та може бути використана як основа для подальших досліджень алгоритмів навчання з підкріпленням у високодинамічних задачах.	uk_UA
dc.language.iso	other	uk_UA
dc.publisher	ХНТУ	uk_UA
dc.subject	Навчання з підкріпленням	uk_UA
dc.subject	машинне навчання	uk_UA
dc.subject	VIZDOOM	uk_UA
dc.title	Дослідження глибокого навчання з підкріпленням у середовищі VizDoom	uk_UA
dc.type	Other	uk_UA
Appears in Collections:	Спеціальність 121 - Інженерія програмного забезпечення

Files in This Item:

File	Description	Size	Format
Вдовиченко В. С. Дослідження глибокого навчання з підкріпленням у середовищі VizDoom.pdf		113.37 kB	Adobe PDF	View/Open

Show simple item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets