Рефлексивный агент как партнёр человека-оператора в управлении сложными человеко-машинными системами
Рефлексивный агент как партнёр человека-оператора в управлении сложными человеко-машинными системами
Аннотация
Код статьи
S207751800006106-5-1
DOI
10.18254/S207751800006106-5
Тип публикации
Статья
Статус публикации
Опубликовано
Авторы
Гришин Евгений Александрович 
Аффилиация: Независимый исследователь и изобретатель
Адрес: Российская Федерация, Москва
Аннотация

Предложен подход, обосновывающий целесообразность включения рефлексивного агента в систему управления сложными человеко – машинными (ЧМ) объектами, действующего попеременно с человеком-оператором, с целью обеспечения их взаимного контроля и страховки в ситуациях приближения к предельным значениям критических параметров объекта управления. Концептуальным отличием предлагаемого подхода от традиционных методов автоматизации является то, что «агент» может осуществлять рефлексивное управление, как управление в условиях полной автономности от человека-оператора. Сформулированы условия равноправного (договорного) взаимодействия человека-оператора и рефлексивного агента в критических ситуациях управления ЧМ-системой, как принцип взаимного резервирования.

Ключевые слова
рефлексивный агент, рефлексивное управление, управление человеко-машинными системами, техногенные катастрофы, взаимное резервирование
Классификатор
Получено
14.08.2019
Дата публикации
10.09.2019
Кол-во символов
27365
Всего подписок
20
Всего просмотров
380
Оценка читателей
0.0 (0 голосов)
Цитировать Скачать pdf

Для скачивания PDF необходимо авторизоваться

1 Различия автоматического и рефлексивного управления.
2 Управление объектом есть способ удержания колеблющихся во времени значений определённых параметров поведения данного объекта в допустимых пределах. Основа автоматического управления – отрицательная обратная связь, то есть обратное влияние выходного сигнала преобразователя на входной. Она синхронно включается при отклонении регулируемого параметра управляемого объекта от нормы и отключается при возврате параметра в допустимые пределы. Иначе говоря, это – стабилизация (синхронное поддержание) нормы выходного следствия через обратное воздействие следствия на входную причину (рис. 1).
3

Рис. 1. Диаграмма Обратной связи с тремя эталонами регулирования

4 В автоматическом управлении выделим три важных типа параметров:
  • Регулируемый, или целевой, параметр (например, число оборотов двигателя),
  • Входной регулирующий параметр (регулятор), например, обогащённость топливной смеси.
  • Переключаемые целевые эталоны пределов (Min – Max) регулирования.
5 Для подстройки объекта к изменяющимся целям поведения и условиям среды необходимо подключение человека-оператора, меняющего (переключающего) эталоны регулирования. Иначе говоря, автоматическое управление объектом не предполагает полной автономии системы от человека-оператора, оставляющего за собой смену целей управления объектом (и интенсивности их достижения).
6 Определим понятие «агент» как автомат, могущий осуществлять рефлексивное управление, как управление в условиях полной автономии от человека-оператора, когда неизменна только сверхзадача, поставленная перед агентом человеком-конструктором – безопасность и выживание объекта управления. Остальные задачи должен будет ставить и разрешать сам рефлексивный агент (РА), взаимодействуя с человеком-оператором и другими РА на основе договора, а не приказа [1]. Основа рефлексивного управления (рис. 2) – анализ фактического исполнения прошлого плана поведения объекта и планирование агентом собственного будущего поведения при изменении им целей и смены условий среды, а также моделирование целей и планов поведения другого агента (человека), осуществляемые на фоне текущего исполнения поискового плана, разработанного в прошлом периоде [2]. Под планом понимается некий упорядоченный список подцелей; необходимым условием исполнения каждой следующей подцели является исполнение предыдущей подцели; исполнение всего списка подцелей должно привести к достижению общей цели.
7

Рис. 2. Структура Рефлексивной машины как информационно-алгоритмическая модель квазиразумного персонажа

8 Получается, что в рефлексивном управлении достижение цели обусловлено исполнением во времени изменяющегося списка подцелей, в то время как в автоматическом управлении заложена непосредственная функциональная (прямая и обратная) зависимость целевого параметра от изменения входного параметра-регулятора. Специфика объекта рефлексивного управления такова, что целевая функция управления, зависящая от условий существования объекта, и само поведение объекта, переменны во времени, но с разной инерционностью. Агенту требуется дополнительное планирование при исполнении специального поискового поведения для определения текущего состояния этих условий и для прогнозирования характера зависимостей. И только потом на этой основе агент должен будет разработать план будущего достижения цели, и исполнить его.
9 Таким образом, с одной стороны, смысл введения рефлексивного управления заключается в увеличении независимости некоего агента (автономности целеполагания, планирования и перепланирования) от человека-оператора, при изначальной постановке человеком-конструктором агенту как сверхзадачи (главной потребности) - безопасности и выживания управляемого объекта.
10 С другой стороны, ограничениями при достижении подобной сверхзадачи являются асинхронность и ресурсная затратность рефлексивной обратной связи, вызываемая:
  • некоторой задержкой на разработку и исполнение плана поискового поведения, для разработки плана достижения основной цели и его исполнения (по сравнению с непосредственной обратной связью при регулировании достижения целевого параметра);
  • рекуррентностью процесса планирования (для разработки плана поведения требуется исполнение поискового плана поведения, который также надо разработать на основе нового поиска, и т.д., до 3-го уровня, на котором план поискового поведения может быть стереотипным).
11 Уясним различия понятий «цель», «план» и «алгоритм». Используем метафору «сценарий-роли». Тогда сценарий, устанавливаемый агентом-организатором, есть аналог цели, а роли – это подцели для агентов-исполнителей. Для достижения каждой из подцелей разрабатывается план (в результате специального поискового поведения агента-организатора), как привязка к конкретным моментам времени, конкретному месту, конкретному агенту-исполнителю и конкретной цифре получаемого (деньги) и затрачиваемого (время, деньги) ресурса.
12 Неисполнение плана достижения любой из подцелей приводит к необходимости перепланирования, т.е. новому процессу привязки каждой из ещё невыполненных (или всех) подцелей к новым моментам времени, месту, агенту и цифре получаемого и затрачиваемого ресурса. В свою очередь, каждая подцель плана может рассматриваться как самостоятельная цель со своим сценарием. Тогда детальный план действий для агента-организатора в целом приобретает иерархическую структуру. Таким образом понятие «план» предполагает наличие жёсткой последовательности исполнения подцелей, привязанных ко времени, месту, исполнителям и ресурсам.
13 С другой стороны, такое понятие, как «алгоритм», также предполагает наличие списка команд, связанных безусловными и условными переходами и образующих деревья и циклы произвольной сложности. Отсюда можно было бы предположить, что «план» есть просто вид «алгоритма», но отличающийся обладанием вышеприведёнными специфическими характеристиками. Однако это не так. Алгоритму операционная система передаёт управление, в результате чего алгоритм исполняется как список команд. Плану же передать управление невозможно, т.к. он есть не список команд, которые надо исполнить, а список данных как условий и следствий исполнения неких команд. Иначе говоря, план есть список данных, которые должен будет читать и интерпретировать соответствующий исполнительный алгоритм [3].
14 Технология разработки плана (или перепланирования), как было сказано, есть процесс привязки каждой из подцелей к конкретным моментам времени, месту, агенту-исполнителю (устройству) и цифре получаемого и затрачиваемого ресурса. Этот процесс осуществляется агентом последовательно во времени, посредством перебора вариантов и принятия решения по каждой кандидатуре на фоне специального поискового поведения по ранее разработанному поисковому плану и алгоритму. Поисковый план осуществляет контроль затрат ресурсов на рекурсивное исполнение поискового алгоритма и, естественно, требует затрат ресурсов на своё функционирование.
15 Ресурсная проблема при применении метода планирования как основы рефлексивного управления может быть решена соотнесением расходов и доходов ресурсов следующим образом: критерием для прекращения процесса поиска варианта решения исполнителя каждой подцели становится соотнесение растущих затрат ресурсов на поиск лучших вариантов исполнения подцелей в разрабатываемом плане, и предполагаемой выгоды (в таких же ресурсах) от реализации самого разрабатываемого плана. Совпадение (или приближение) величин затрат и выгоды и есть команда на то, что процесс поиска и принятия решения пора завершать и выбирать последний или лучший из уже полученных вариантов.
16 Подведём промежуточный итог. Концептуальным отличием предлагаемого рефлексивного подхода к управлению объектом от традиционных подходов является более высокая степень автономности (независимости от человека-оператора) поведения рефлексивного агента в высокоизменчивой и непредсказуемой окружающей природной и социальной среде [4].
17 Автономность поведения РА целесообразна во многих случаях, когда непосредственное участие человека-оператора в процессе управления объектом нерационально (он тормозит протекание процессов в объекте управления), или опасно для человека-оператора, или человек неадекватен и создаёт угрозу безопасности для управляемого объекта. В то же время РА целесообразен в условиях невозможности полной автоматизации процесса управления (невозможности исключения участия человека в процессе управления). Однако, автономность поведения РА достигается ценой повышенного расхода ресурсов РА (времени и денег) на перманентное перепланирование своего поведения, а также ценой отказа от удобного приказного воздействия человека на автомат и неудобного перехода на их договорное взаимодействие [1].
18 Технологические различия рефлексивного управления и автоматического управления сводятся к следующему:
  • традиционный подход к управлению основан на автоматическом исполнении «зашитых» конструктором программ или автоматической генерации алгоритмов/программ в блоках логического вывода интеллектуальных систем или в нейросетях).
  • рефлексивное управление основано на генерации агентом целей и планов своего будущего поведения на фоне его текущего поискового поведения, осуществляемого по стереотипному рекурсивному алгоритму, контролируемому по расходу ресурсов посредством стереотипного плана [2]. Здесь принципиальным является как раз факт симбиоза (сосуществования) в рефлексивном управлении обоих рассмотренных категорий - алгоритма и плана. Смысл и эффект подобной синергии изложен автором в полученном им патенте РФ на изобретение «Способ автоматического прерывания задач, находящихся в цикличности» [5].
19 Далее рассмотрим дополнительные возможности, предоставляемые использованием метода рефлексивного управления ЧМ-системой.
20 Соображения по поводу степени автоматизации управления в ЧМ-системах и целесообразности взаимного резервирования.
21 Важнейшие вопросы:
22
  1. Что собой представляет РА, какова его структура и функции?
  2. Когда, как и в какой степени можно передавать от человека-оператора автономному рефлексивному агенту право на самостоятельное управление сложными объектами, включающими людей? Каков он, этот критерий?
23 Статистика говорит о том, что от 70% до 90% мировых техногенных катастроф происходит по вине человека (операторов, разработчиков и управленцев). Поиск способов предотвращения подобных ситуаций приводит к необходимости рассмотрения способа передачи права РА временно управлять ЧМ – системой, когда управление человеком-оператором по тем или иным причинам выводит систему за допустимые пределы значений параметров существования. И наоборот, управление ЧМ – системой должно неукоснительно передаваться оператору, когда управление РА не приводит к улучшению ситуации или её ухудшает.
24 Критериями для передачи управления ЧМ-системой РА или оператору могут быть следующие:
25
  • формальное определение понятия «критическая ситуация», как списка измеряемых параметров объекта, нормативов их значений, по которым фактические значения оказались в «красной зоне».
  • динамически изменяемая длительность интервала времени, на который в критической ситуации передаётся оператору или РА управление ЧМ-системой, в зависимости от результата управления одного из них в только что закончившемся интервале времени.
26 Функция определения состояния «критическая ситуация» должна исполняться РА на основе компарации фактических данных, полученных от датчиков, и нормативов по критическим параметрам объекта управления. Функция определения динамически изменяемой длительности интервала времени и переключения управления между оператором и РА должна исполняться операционной системой, которой РА передаёт результаты компарации фактических данных и нормативов параметров и выводы относительно ухудшения или улучшения ситуации после предыдущего интервала управления оператором или РА.
27 Выдвинем предположение, что посредством реализации принципа попеременного переключения управления ЧМ–системой между оператором и РА и в результате их взаимного контроля и страховки возможно достичь большей эффективности в разрешении проблемных ситуаций и снижения вероятности техногенных катастроф. Такое предположение должно быть многосторонне и многократно верифицировано на тренажёрах, обучающих операторов. Естественно, что в такие тренажёры должны быть встроены РА.
28 Обобщённая схема включения РА в структуру управления ЧМ–системой предполагает составляющие: Операционная система РА, собственно РА, Оператор, Приборная доска, Органы ручного управления, Автопилот, Объект управления (Рецепторы, Эффекторы), Среда материально-вещественного или информационно-алгоритмического преобразования (рис. 3).
29

Рис. 3. Стереотипная схема включения Рефлексивного агента: а) в структуру управления ЧМ – системой; б) в структуру тренажёра – оператора управления ЧМ – системой.

30 Статут рефлексивного агента в управляемой ЧМ-системе таков:
31
  • Рефлексивный агент в ЧМ-системе должен осуществлять постоянный самостоятельный мониторинг управляемого объекта и внешней среды, чтобы в любой момент «осознать» ситуацию как критическую, когда тот или иной жизненно важный ресурс управляемого объекта оказывается близок или превышает допустимый предел.
  • РА должен сообщить об этом ОС и включить средства аварийного оповещения операторов и людей.
  • Если операторы по какой-либо причине в расчётное время не реагируют на «ревун», или реагируют, но кризис усугубляется, ОС должна передать управление РА и Автопилоту для немедленного восстановления параметров функционирования объекта, обеспечивающих, прежде всего, сохранение жизни людей.
  • Если в течение заданного ОС ограниченного интервала времени РА (вместе с Автопилотом) не обеспечили снижения критичности значений параметров объекта и возврата их к норме, ОС обязана передать управление оператору, но уже на уменьшенный интервал времени.
  • Если оператор успевает снизить своим управлением критичность ситуации за уменьшенный интервал времени, ОС оставляет управление на следующий интервал времени за оператором. Если оператор не успел снизить своим управлением критичность ситуации, ОС принудительно передаёт управление РА.
  • Далее процесс передачи/возврата ОС управления между партнёрами продолжается циклически, снижая или увеличивая интервалы между передачами управления до возврата к некритическим состояниям объекта управления.
32 Таким образом, рефлексивный агент в ЧМ - системе должен находиться в постоянном самостоятельном мониторинге состояния объекта и среды и готовности взять управление на себя на ограниченный интервал времени в критической ситуации угрозы безопасности объекта. В условиях, когда управление передано оператору, РА должен с увеличивающейся частотой отслеживать динамику изменения критичности ситуации и упреждающе модельно перепланировать управление объектом. При возрастании критичности ситуации сверх нормы РА должен принудительно брать управление на себя. В этом случае, его главная задача - устранить непосредственную опасность необратимых последствий от произведённого оператором действия или от его бездействия.
33 Может оказаться, что от усилий РА критичность ситуации устранится не полностью. Тогда, через расчётное время, РА должен вновь передать управление человеку. И вновь продолжить отслеживать динамику изменения критичности ситуации с соответствующим модельным перепланированием. Иначе говоря, рефлексивный агент в ЧМ-системе должен работать постоянно, с переменной частотой рефлексии объекта управления и среды, зависящей от скорости развития критичности ситуации, и с готовностью в любой момент взять управление на себя.
34 При этом в некритической ситуации РА:
35
  • добровольно по просьбе оператора передаёт ему управление,
  • добровольно по просьбе оператора принимает на себя управление.
36 В критической ситуации РА:
37
  • принудительно возвращает себе управление от оператора,
  • принудительно передаёт оператору управление (при неспособности исправить положение частично или полностью).
38 В этом заключается предлагаемый рефлексивный подход к использованию принципа взаимного резервирования человека и автоматики, предложенного А. Н. Костиным [6]. Костин пишет: «…Взаимное резервирование позволит реализовать своеобразную форму активной помощи или даже страховки человека в критических ситуациях, а разработчики автоматики будут в определенной мере гарантированы от операторских ошибок. Тем самым фактически реализуется обоюдная защита и оператора, и техники. Кроме того, оператор не будет чувствовать себя брошенным в одиночестве перед многообразной сложностью техники, а разработчики - устраненными из процесса управления».
39 Идея построения рефлексивного агента (РА) имеет в своей основе главное допущение:
40
  • РА способен рефлексировать приближение конечных критических состояний управляемого объекта,
  • РА способен в реальном времени перепланировать поведение управляемого объекта в этих критических обстоятельствах.
41 Это особенно важно в случае, когда РА встроен в систему управления сложной ЧМ-системой. Здесь наиболее существенна проблема разработчика: как распределять передачу управления между человеком и автоматом в критических ситуациях:
42
  • передать управление человеку и выключить автомат,
  • передать управление автомату и устранить участие человека,
  • организовать попеременную передачу управления человеку или автомату с одновременным контролем одного другим (взаимная страховка).
43 Логично посчитать, что пункт 3 наиболее рационален в условиях роста критичности ситуации и увеличивающегося дефицита времени для решения. В этом случае на проектировщика РА ложится ответственность разработки моделей, на основе вычислений которых будут определяться временные интервалы управления объектом для оператора и РА, и их динамика. С другой стороны, фактически вычисление подобных моделей РА может основываться только на показаниях датчиков (автоматов) или людей, и эти показания также могут быть неадекватными реальности по разным причинам. А также сама модель принятия решения может не учитывать неких неожиданных обстоятельств. Выход из положения может быть таков:
44
  • Проектировщик должен предусмотреть максимальное использование РА всех дублированных источников информации о состоянии жизненно важных систем и окружающей обстановки, к которым есть доступ. При этом для РА и операторов полные наборы датчиков должны быть самостоятельными и дублированными.
  • Собранную дублированную информацию РА должен ускоренно верифицировать на предмет её достоверности, чтобы была возможность отбраковать ненадёжные источники и использовать надёжные в реальном времени для принятия решений.
  • РА должен быть снабжён моделью-конструктором формирования той репрезентативной выборки из дублированных источников (датчиков), на основе которой оператор и РА будут принимать решения о своих действиях в той или иной критической ситуации.
45 К слову, примеры разнообразных катастроф показывают, что в критический момент во многих случаях автоматика просто отключалась человеком от управления, и за ней оставлялась только функция сигнализации о развитии критической ситуации.
46 Все вышеизложенные идеи должны моделироваться на тренажёре! Тренажёр должен не только фиксировать неправильные действия оператора, а сам (то есть встроенный в него РА) брать управление на себя и принимать решения о способе выхода из критических ситуаций, созданных генератором случайных чисел! Разработчик ЧМ - системы должен на тренажёре использовать все возможности проверки действий оператора и РА, конфликтующих в критической ситуации. И, конечно, весь процесс взаимодействия оператора и РА должен протоколироваться, сначала в тренажёре, а потом в реальных обстоятельствах.
47 Общая постановка задачи построения тренажёров по обучению операторов для работы в ЧМ-системах с рефлексивными агентами.
48 Существуют тренажёры для обучения операторов управлению сложными техническими системами (объектами) в реальном времени. Однако они не учитывают нововведений, связанных с предстоящим внедрением в системы управления сложными ЧМ-системами рефлексивных агентов. Предложим концепцию разработки дополнительной диалоговой программы-рефлексивного агента, позволяющей осуществлять как рефлексивное управление сложными ЧМ-системами, так и обучение поведению операторов в подобных ЧМ-системах с встроенными РА в экстремальных ситуациях, и тестирование операторов на предмет профпригодности.
49 В подобных тренажёрах должен быть встроен рефлексивный агент, подобный РА в системе управления ЧМ-системой. Он должен отслеживать складывающуюся модельную обстановку с системами объекта и в окружающей объект среде, и случайным для оператора образом выдавать ему на экран сообщения в виде диалоговых окон. Каждое сообщение должно характеризовать некую неординарную ситуацию в стандартном процессе преобразований в объекте управления, требующую принятия оператором конкретного решения и действия. Новое сообщение может дополнить предыдущее, если решение оператором по предыдущему сообщению ещё не принято. Характеристика неординарной ситуации в сообщении представляет собой набор критических параметров и их значений текущего состояния систем объекта и окружения объекта.
50 Оператору предлагается меню с перечнем вариантов поведения для разрешения ситуации на выбор. Меню содержит варианты с разной степенью адекватности сложившейся обстановке. Варианты могут предлагаться одновременно списком или появляться последовательно во времени. С момента появления на экране сообщения, программа-агент отображает в диалоговом окне таймер, показывающий изменяющийся остаток времени до окончания периода принятия решения оператором. Оператор должен успеть принять решение и выбрать вариант поведения в остаток времени. Остаток времени может дополнительно уменьшаться в зависимости от неверности его предыдущего выбора, или увеличиваться при верном выборе.
51 Если оператор подтвердил ОС, что выбрал решение, или не успел его принять за выделенный интервал времени, ОС переключает управление на РА. Если оператор выбрал неверное решение, увеличивающее критичность значений жизненно важных параметров объекта управления, РА в отведённый ему интервал времени осуществляет перепланирование модели режимов работы систем объекта и окружения объекта. Исходя из выполненных РА при перепланировании изменений модели режима и окружения и оценки их степени и знака (оптимально/критично), ОС формирует новый интервал времени и переключает управление на оператора. РА посылает очередное сообщение оператору, включающее:
52
  • оценку степени оптимальности/критичности его предыдущего решения,
  • перечисление изменений в обстановке вследствие его неверного решения,
  • перечень действий РА, совершённых после передачи ему управления, по снижению критичности ситуации,
  • справку по текущей ситуации с оценкой её проблемности,
  • список вариантов для устранения проблем оператором,
  • таймер с посекундно снижающимся остатком интервала на принятие решения.
53 При своевременном и приемлемом выборе оператором варианта поведения, РА переходит к сообщению, содержащему положительную оценку предыдущего решения оператора, меню следующего этапа и таймер с увеличенным остатком интервала на принятие решения. И так далее. Если на последнем этапе оператор принимает своевременное и приемлемое решение, то задача обучения оператора поведению в заданной ситуации считается выполненной и тестирование завершается. Подсчитывается общее и потраченное на каждом этапе на принятие решений время, а также расход ограниченных ресурсов. Полученные характеристики сравниваются с нормативами. Соответственно результатам сравнения рассчитывается оценка действий оператора, и, в конечном итоге, его классность. С целью повышения классности оператора программа-агент усложняет критичность ситуаций, требования к расходу ресурсов и времени реакции оператора. Таким образом, программа-агент осуществляет:
54
  • постоянный мониторинг (рефлексию) текущих изменений режима работы систем объекта и окружающей среды объекта (оперативной обстановки),
  • обмен сообщениями с оператором (диалог),
  • оценку адекватности выбора оператором варианта управления объектом в ответ на сообщения об изменениях ситуации с объектом и окружающей средой,
  • учёт влияния неадекватных решений оператора на управление объектом и на среду,
  • рефлексивное перепланирование в реальном времени модели режимов работы систем объекта после каждой неадекватной реакции оператора и каждого негативного изменения в окружающей среде (в оперативной обстановке).
55 Предполагается настройка программы-агента на психофизиологические характеристики конкретного обучаемого оператора по следующим моментам:
56
  • учёт статистики времени реакции оператора на конкретные критические ситуации,
  • учёт статистики и обобщение типичных ошибок и удач оператора.
57 Выводы
58 1. Как было сказано выше, концептуальным отличием предлагаемого рефлексивного подхода к управлению объектом от традиционных подходов автоматизации является более высокая степень автономности поведения рефлексивного агента от человека-оператора в высокоизменчивой и непредсказуемой окружающей среде.
59 Автономность поведения РА целесообразна во многих случаях, когда непосредственное участие человека-оператора в процессе управления нерационально или опасно для человека-оператора, или человек-оператор неадекватен и создаёт угрозу безопасности для управляемого объекта. Автономный РА целесообразен также в случаях невозможности полной автоматизации процесса управления (невозможности исключения участия человека в процессе управления) в силу несовершенства научного и технологического знания.
60 Однако автономность поведения РА может оказаться нецелесообразной, так как она достигается ценой повышенного расхода ресурсов РА (времени и денег) на перманентное перепланирование своего поведения, а также ценой отказа от удобного приказного воздействия человека на автомат и неудобного перехода на их договорное взаимодействие [4].
61 2. И всё-таки решение о целесообразности широкого применения идеи рефлексивного управления в системах управления сложными ЧМ-системами, на наш взгляд – вопрос ближайшего будущего. Основанием для такого вывода является расширяющийся интерес к идее автономности виртуально агента и робота, а также интерес к морально-этическим проблемам сосуществования человека и квазиразумного искусственного существа. Видимо, эти проблемы разрешимы, прежде всего, на пути признания равноправия естественных и искусственных индивидов хотя бы в форме договорного, а не приказного взаимодействия.
62

Резюмируя, сделаем предположение, что посредством реализации принципа попеременного переключения управления ЧМ – системой между оператором и РА и в результате их взаимного контроля и страховки возможно достичь большей эффективности в разрешении проблемных ситуаций и снижения вероятности техногенных катастроф.

63 3. В результате включения Рефлексивного агента в систему управления тренажёром по обучению операторов для работы в ЧМ-системах достигается следующее:
64
  • Обеспечивается привыкание человека-оператора к равноправному взаимодействию с РА как с партнёром в процессе обучения, что психологически необходимо человеку-оператору в реальной обстановке для преодоления стресса в неординарных и критических ситуациях.
  • Вырабатывается доверие человека-оператора к РА как партнёру, c которым возможно взаимно контролировать и страховать друг друга при возможных неправильных действиях обоих.

Библиография

1. Гришин Е.А. Рефлексивный программный движок как основа разработки квазиразумных виртуальных агентов // Искусственные общества. 2017, Т. 12, №1-2 URL: https://artsoc.jes.su/s207751800000100-9-1

2. Гришин Е.А. Инвариантная структура рефлексивных машин // Искусственные общества. 2016, Т. 11, №1-4 URL: https://artsoc.jes.su/s207751800000003-2-4

3. Гришин Е.А. Автономный агент искусственного общества как «целое», «живое», «сознающее»: попытка моделирования. // Искусственные общества. 2018, Т. 13, №3 URL: https://artsoc.jes.su/s207751800000128-9-1

4. Гришин Е.А. Автономный виртуальный агент как квази-личность // Искусственные общества. 2018, Т. 13, №4 URL: https://artsoc.jes.su/s207751800000134-6-1

5. Гришин Е.А. Патент РФ «Способ автоматического прерывания задач, находящихся в цикличности». 2013 г. https://findpatent.ru/patent/243/2438170.html

6. А. Н. Костин: Автоматизация и человек: мечты и реальность. // URL: http://www.kinnet.ru/cterra/389/8084_2.html