РОЗРОБКА АДАПТИВНОГО МЕТОДУ КЕРУВАННЯ БПЛА НА ОСНОВІ ГЛИБОКОГО НАВЧАННЯ З ПІДКРІПЛЕННЯМ ТА ДОМЕННОЇ РАНДОМІЗАЦІЇ

Автор(и)

  • В.Л. Закревський
  • О.С. Приходько

DOI:

https://doi.org/10.36910/775.24153966.2025.84.39

Ключові слова:

БПЛА, навчання з підкріпленням, PPO, адаптивний контролер, доменна рандомізація, динаміка польоту

Анотація

У роботі розглядається проблема створення адаптивної системи керування безпілотним літальним апаратом (БПЛА) для роботи в умовах стохастичної невизначеності. Запропоновано підхід на основі алгоритму Proximal Policy Optimization (PPO) із застосуванням стратегії доменної рандомізації параметрів середовища. Розроблено структуру нейронної мережі та функцію винагороди, що забезпечують баланс між точністю навігації та енергоефективністю. Розроблений контролер продемонстрував здатність адаптуватися до змін маси корисного навантаження (до 20%) та зовнішніх вітрових збурень без необхідності ручного переналаштування коефіцієнтів. Результати порівняльного моделювання підтверджують перевагу запропонованого методу над класичним ПІД-регулятором: час стабілізації зменшено в 1.5 рази, а максимальне відхилення при збуреннях – на 40%.

Посилання

Завантаження

Опубліковано

2026-01-06

Номер

Розділ

Статті