Релейне керування відносним рухом космічних апаратів із використанням навчання з підкріпленням

Хорошилов, СВ, Ванг, Ч
Косм. наука технол. 2024, 30 ;(2):01-01
Мова публікації: Англійська
Анотація: 
У статті розглянута задача керування відносним рухом космічних апаратів за допомогою реактивних виконавчих органів, вихід яких має два стани "включено" або "вимкнено". Для випадків коли роздільна здатність реактивних двигунів не забезпечує якісну апроксимацію лінійних законів керування з використанням широтно-імпульсного модулятора тяги досліджено можливість застосування навчання з підкріпленням для прямого знаходження законів керування, що встановлюють зв'язок між вектором стану і командами включення-вимикання реактивних двигунів. Для реалізації такого підходу отримано модель керованого відносного руху двох супутників у формі Марківського процесу прийняття рішень. Інтелектуальний агент представлений у вигляді нейромережевого «виконавця» та «критика» та визначено архітектури цих модулів. Запропоновано використовувати функцію вартості зі змінними ваговими коефіцієнтами керуючих впливів, що дозволяє оптимізувати кількість включень реактивних двигунів явним чином.
      Для підвищення якості керування запропоновано використовувати розширений вектор входу для нейромережевого виконавця та критика інтелектуального агента, який крім вектора стану ще включає інформацію про керуючу дію на попередньому такті керування та номер такту керування. Для зменшення часу навчання використано попереднє навчання агента на даних, отриманих за допомогою традиційних алгоритмів керування. Чисельні результати демонструють, що використання методології навчання з підкріпленням дозволяє перевершити результати, що забезпечуються лінійним контролером із широтно-імпульсним модулятором, з точки зору точності керування, швидкодії та кількості включень реактивних двигунів.
Ключові слова: відносне керування космічним апаратом, виконавець, включення реактивного двигуна, критик, навчання з підкріпленням, нейронна мережа, релейне керування