Гибридный подход к распознаванию действий человека
Ключевые слова:
распознавание действий человека, гибридная модель, MediaPipeАннотация
В статье предложен гибридный подход к распознаванию действий человека, сочетающий нейросетевое извлечение скелетных признаков с детерминированным геометрическим анализом на основе аппарата векторной алгебры и трёхмерных аффинных преобразований. В отличие от традиционных решений, требующих повторного обучения модели при добавлении нового действия, разработанная система позволяет пользователю динамически задавать и модифицировать набор распознаваемых действий без участия специалиста в области машинного обучения. Каждое действие определяется как последовательность поз, описываемых взаимным расположением ключевых точек тела. Сравнение текущей и эталонной позы осуществляется через усреднённое косинусное сходство векторов, а устойчивость к изменениям ракурса обеспечивается за счёт перебора углов аффинных преобразований в 3D-пространстве. Программный прототип реализован на языке Python с использованием фреймворков MediaPipe и OpenCV, оснащён интуитивно понятным графическим интерфейсом и работает с обычной веб-камерой. Экспериментальная апробация подтвердила корректность распознавания заданных действий с точностью не ниже 76 % в условиях естественного выполнения и устойчивость к ошибкам ввода данных. Решение ориентировано на применение в вычислительных системах и комплексах, где важны гибкость настройки, интерпретируемость и низкий порог вхождения. doi 10.54708/19926502_2025_29411030Загрузки
Опубликован
2025-25-12
Выпуск
Раздел
******************************