Виртуальные траектории и механическое сопротивление

ROBOT CONTROL

Примитивы динамического движения: обзор статьи

https://studywolf.wordpress.com/2013/01/07/dynamic-primitives-of-motor-behavior-paper-review/

 

ОБЗОР СТАТЬИ

«Dynamic primitives of motor behavior»

«Примитивы динамики моторного поведения»

Neville Hogan, Dagmar Sternad

2012

http://www.ncbi.nlm.nih.gov/pubmed/23124919

 

Эта статья начинается с утверждения о необходимости теории управления движением, которая выходит за рамки одной задачи и ситуации, это близко и дорого мне тоже. Они ставят проблему разработки всеобъемлющей теории, как соперничество авторов, предлагающих теории, что замедляет усвоение идей и развитие всеохватывающей структуры. Выделенные здесь 2 из наиболее важных особенностей любой всеобъемлющей теории – это учёт ею широких классов действий и главных ограничений нервно-мышечной системы человека, причём выделенным ограничением является низкая скорость центробежных (efferent) и центростремительных (afferent) сигналов.

 

Синергия и примитивы динамики

Авторы статьи предполагают, что управление движением человека кодируется исключительно с точки зрения примитивных динамических действий, что определенно не является новым предложением, но следствия его не были полностью исследованы. Когда люди думают о комбинировании примитивных действий, чаще всего возникает идея синергии, которая относится к «стереотипным моделям одновременного движения нескольких суставов или одновременной активации нескольких мышц, которые могут упростить управление». Основная идея заключается в том, что синергия может обеспечить средство уменьшения размерности контроллера, вместо беспокойства о передаче выходного сигнала активации каждому мускулу, контроллер модулирует набор более крупных действий, соединяя их одновременно или последовательно. Это значительно упрощает выполнение сложных действий.

Авторы утверждают, что использование этого определения синергии недостаточно для формирования всей сложности поведения, наблюдаемого у людей: «эта оценка синергии представляет собой алгебраическое ограничение (algebraic constraint), а не динамический объект. Даже изменяющаяся во времени синергия не является динамическим объектом, но представляет собой кинематическую связь-ограничение (kinematic constraint) с включённым, как одна из переменных, временем, связанным с этим ограничением». Т.е., я полагаю, что это определение синергии является строго прямой связью (strictly feedforward) (открытый контур, без обратной связи – open-loop) упрощённой вещью. Это просто набор мышечных активаций, которые выполняются в заданном порядке, без учёта начальной точки, возмущений (perturbations) или окружающей среды. В этом смысле они статичны, не адаптируются к динамическим средам.

Итак, нужно что-то ещё: «одного сокращения измерений команд недостаточно для понимания управления людьми сложными динамическими объектами. Для этого примитивы управления сами должны быть динамическими объектами». На этом этапе они обсуждают примитивы динамики, представленные в лаборатории Schaal ещё в начале 2000-х гг. Основная идея примитивов динамики заключается в том, что в пространстве состояний существует целевая точка, к которой система тянется (drawn to) (в соответствии с динамикой упругости – spring dynamics), и есть определяемая временем функция (time-driven function), которая активирует функцию усилия, которая может интересующим образом перемещать систему вдоль её пути к цели. Примитивы динамики могут генерировать как дискретные, так и ритмичные движения, т.е. они могут действовать как точечные аттракторы (точки притяжения – point attractors) или предельные циклы (limit cycles)[1].

В дискретном случае определяемая временем функция, стремится к 0, уменьшая влияние функции усилия до 0, позволяя динамике упругости по умолчанию взять верх и подтянуть систему к цели, гарантируя сходимость. В ритмическом случае определяемая временем функция уходит в бесконечность и берётся косинус, чтобы ритмичным образом активировать функцию усилия, где её движения сосредоточены вокруг цели в пространстве состояний. Существует множество действительно интересных и удивительных вещей, которые можно сделать с примитивами динамики, но и этого должно быть достаточно для обсуждения этой статьи.

Взяв примитивы динамики в качестве нашего определения синергии, можно сгенерировать значительно более устойчивое поведение, чем при альтернативном определении, потому что примитивы динамики – это больше, чем последовательность мышечных активаций, они являются аттракторами с динамикой, которые могут направлять систему несмотря на возмущения и другие шумы. Авторы называют это свойство «временным постоянством (temporary permanence) (постоянство из-за устойчивости к возмущению; временное, потому что примитивы динамики, такие как фонемы речевого общения, могут иметь ограниченную продолжительность)».

Дискретные и ритмические примитивы динамики затем редактируются и обозначаются «элементами движения» (submovements) и «осцилляторами» (oscillators), если имеют явное математическое суммирование или профиль скорости с одним пиком, соответственно.

 

Виртуальные траектории и механическое сопротивление

Идея состоит в создании виртуальной траектории следования для системы, путём объединения этих элементов движения и осцилляторов, создавая «аттрактор траектории». Хотя комбинации элементов движения и осцилляторов могут составлять обширную совокупность движений в неограниченной среде – их недостаточно для описания каких-либо вовлеченных взаимодействий (involving interactions) с окружающей средой. Нужно ещё одно понятие – механическое сопротивление (mechanical impedance). Оно вводится как особенность, которая должна учитываться при построении виртуальных траекторий. Механическое сопротивление определяет силу, вызванную смещением части системы на протяжении всего движения. Люди контролируют механическое сопротивление, подбирая необходимое совместное сокращение (modulating co-contraction) групп мышц-антагонистов, жёстко удерживая конечность на месте или позволяя ей свободно колебаться в ответ на приложенное внешнее усилие. Механическое сопротивление для данной задачи – это функция, которая описывает, как реагировать на внешние силы в течение всего времени движения. Точно так же как элементы движения и колебания, механические сопротивления для различных задач могут быть объединены посредством линейной суперпозиции, чтобы создать новую функцию.

Включение механического сопротивления в спецификацию движения ведёт к некоторым действительно хорошим эффектам. Авторы представляют несколько случаев.

Одним из них является локомоция (locomotion)[2], вместо 2х разных примитивных движений для разных типов локомоции (таких как, например, нормальная ходьба и хождение на стопах-шарах) можно иметь один состав элементов движений и осцилляторов, варьируя профиль жёсткости сустава (механическое сопротивление) на протяжении движения.

Другой случай – протягивание руки к дверной ручке и манипуляции с ней. Один из способов сделать это – получить точную модель, детализирующую путь, по которому рука должна достаточно близко подойти к объекту, адаптироваться к нему со временем для соответствующего приложения крутящего момента для открывания двери. Но более простой способ – имея грубую модель расположения дверной ручки и её формы, выполнять движение с малым механическим сопротивлением, позволяя руке обхватить объект надлежащим образом при установлении контакта (эффективность последнего метода также показана в статье при моделировании).

Ещё один момент, управление механическим сопротивлением позволяет задавать параметры прямой связи, представляя соответствующие реакции в ситуациях, когда контакт с объектом слишком быстрый, чтобы управление на основе обратной связи реагировало правильно.

Таким образом, предполагая, что у нас есть наборы наших 3х классов примитивов: элементы движений, осцилляторы и механическое сопротивление; виртуальная траектория может быть сгенерирована с использованием доступных примитивов в качестве базовых функций, которые не могут быть объединены посредством взвешенного суммирования. Авторы предлагают «кое-что, что можно изучить, закодировать и выправить, являются параметрами примитивов динамики, а не какими-либо деталями поведения».

 

Комментарии

В этой статье было много интересных идей, будучи уже знакомым с примитивами динамики и композиционным движением (я уже использовал их в собственной работе), наиболее интересная часть для меня была включением механического сопротивления в качестве функции движения для регулирования (modulation). Пример дверной ручки особенно убедительно показывает, что включение сопротивления добавляет движениям прочности и мощности. Большим бонусом использования примитивов динамики в качестве основы управления двигательной системой является то, что уже проделана огромная работа по подключению к примитивам динамики обучения (хотя и не спроектирована с намерением на производительные нейронные связи (neural plausibility)[3]), в частности, работа Evangelous Theordoro по улучшению политики, интегральной по путям (path integral policy improvement), выполненной в лаборатории доктора Schaal.

       Термины «виртуальные траектории» и «траекторный аттрактор» кажутся мне опасными легкостью их неверной интерпретации, когда они могут показаться скорее способом определения кинематической траектории, чем результатом объединения ряда динамических аттракторов системы.

       Предполагаю, что уменьшенная полоса пропускания необходима для подбора набора примитивов, а – не спецификации полного управляющего сигнала. Способность этих членов регуляции определять соответствующие реакции на любую встречающуюся внешнюю силу является средством решения проблемы скорости передачи из начала этой статьи. Изучение регулируемых сигналов заданного набора примитивов – это ещё одна особенность, и она мне нравится, в отличие от указания явных активаций мышц. Потому что у первого подхода есть потенциал позитивно использовать любую встроенную в спинной мозг схему, т.к. очень часто эта сложнейшая структура, через которую проходят моторные сигналы, игнорируется.

       Наконец, повторяемая тема статьи также обосновывает всеобъемлющую теорию, что может быть фальсифицирована, но которую можно постепенно наращивать и пересматривать, а не отбросить, как только какой-то эксперимент дал противоречивые данные. За последнее время это ещё один вызов на поле и план атаки, за которым я последовал бы сам. Возможно, я бы попытался их направить к структуре Иерархии Нейроно-Оптимального Управления (Neural Optimal Control Hierarchy framework), которую строил я...

 


[1] Предельный цикл (limit cycle) — это один из возможных вариантов стационарного состояния системы в теории динамических систем и дифференциальных уравнений; предельным циклом векторного поля на фазовой плоскости или, более обобщённо, на каком-либо двумерном многообразии называется замкнутая (периодическая) траектория этого векторного поля, в окрестности которой нет других периодических траекторий.

Эквивалентным является утверждение: всякая достаточно близкая к предельному циклу траектория стремится к нему либо в прямом, либо в обратном времени.

Теоремы Пуанкаре-Бендиксона и Андронова-Понтрягина утверждают, что типичная система с непрерывным временем на плоскости (физически говоря — состояние которой задаётся 2мя вещественными параметрами, скажем, напряжением и током, или положением и скоростью точки на прямой) может стремиться только к положению равновесия или к предельному циклу.

https://ru.wikipedia.org/wiki/Предельный_цикл

https://en.wikipedia.org/wiki/Limit_cycle

[2] Локомоция роботов – это собирательное название различных методов, которые используют роботы для собственного перемещения с одного места на другое (катание, скольжение, плавание, вышагивание, ходьба и бег на 2х ногах, подпрыгивание, гибридное перемещение и пр.).

           https://en.wikipedia.org/wiki/Robot_locomotion

[3] Biological plausibility – «причинная связь» – биологическая достоверность – прослеживаемая связь должна быть логически последовательной, т.е. достоверной и объяснимой с биологической точки зрения и согласующейся с известными фактами из естественного развития и биологической природы заболевания.

https://universal_en_ru.academic.ru/563058/biological_plausibility
https://tools.pharm-community.com/databases/dictionary/term/3647
https://en.wikipedia.org/wiki/Biological_plausibility

https://ru.qwertyu.wiki/wiki/Biological_plausibility
«The former methods are dependent on energy-inefficient real-valued computation and non-local transmission, as also required in artificial neural networks (ANNs), whereas the latter are either considered to be biologically implausible or exhibit poor performance. Hence, biologically plausible (bio-plausible) high-performance supervised learning (SL) methods for spiking neural networks (SNNs) remain deficient» [https://arxiv.org/pdf/1812.06574.pdf]

 


Дата добавления: 2019-11-16; просмотров: 142; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!