DEVELOPMENT OF AN ADAPTIVE UAV CONTROL METHOD BASED ON DEEP REINFORCEMENT LEARNING AND DOMAIN RANDOMIZATION

V.L. Zakrevskyi; O.S. Prykhodko

doi:10.36910/775.24153966.2025.84.39

Автор(и)

В.Л. Закревський
О.С. Приходько

DOI:

https://doi.org/10.36910/775.24153966.2025.84.39

Ключові слова:

БПЛА, навчання з підкріпленням, PPO, адаптивний контролер, доменна рандомізація, динаміка польоту

Анотація

У роботі розглядається проблема створення адаптивної системи керування безпілотним літальним апаратом (БПЛА) для роботи в умовах стохастичної невизначеності. Запропоновано підхід на основі алгоритму Proximal Policy Optimization (PPO) із застосуванням стратегії доменної рандомізації параметрів середовища. Розроблено структуру нейронної мережі та функцію винагороди, що забезпечують баланс між точністю навігації та енергоефективністю. Розроблений контролер продемонстрував здатність адаптуватися до змін маси корисного навантаження (до 20%) та зовнішніх вітрових збурень без необхідності ручного переналаштування коефіцієнтів. Результати порівняльного моделювання підтверджують перевагу запропонованого методу над класичним ПІД-регулятором: час стабілізації зменшено в 1.5 рази, а максимальне відхилення при збуреннях – на 40%.

РОЗРОБКА АДАПТИВНОГО МЕТОДУ КЕРУВАННЯ БПЛА НА ОСНОВІ ГЛИБОКОГО НАВЧАННЯ З ПІДКРІПЛЕННЯМ ТА ДОМЕННОЇ РАНДОМІЗАЦІЇ

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

Завантаження

Опубліковано

Номер

Розділ

Мова

Інформація

Зробити подання