
Високият 1,3 метра Unitree G1 – с прякор „Little Potato“ – току-що представи плавно подреждане в три стъпки в реалния свят, отбелязвайки момент на пробив в атлетичните умения на хуманоидния робот. Не, все още не е готов за драфта на НБА, но тази наскоро отключена способност за „баскетбол в реалния свят“ предполага, че може да не мине много време преди да спечели титулярно място в масовия китайски „Village BA“.
Според екипа това е първата в света демонстрация на робот, изпълняващ баскетболни действия в реална среда. Работата идва от изследователска група в Хонконгския университет за наука и технологии (HKUST).

Въпреки че изследователите все още не са публикували пълни технически подробности, демонстрацията изглежда е изградена върху предишната им работа по преподаване на баскетболни умения на роботи чрез обучение по имитация и контрол, базиран на физика.
SkillMimic-V2 (SIGGRAPH 2025)
Основата на този нов напредък се проследява назад към SkillMimic-V2: Изучаване на стабилни и генерализируеми умения за взаимодействие от оскъдни и шумни демонстрации, приети от SIGGRAPH 2025.

SkillMimic-V2 се справя с един от най-големите проблеми при обучението за укрепване от демонстрации (RLID): данните за движението в реалния свят често са оскъдни, шумни и им липсва покритие между вариациите на уменията и преходите.
Чрез въвеждането на съединени графики на траектория (STG), полета за преход на състоянието (STF) и вземане на проби от адаптивна траектория (ATS), системата е в състояние да научи плавни, възстановими, обобщаващи умения за взаимодействие – дори от несъвършени демонстрации.

Традиционните набори от данни за улавяне на движение страдат от три основни проблема:
- Разредени: Ограничени вариации и без преходни движения.
- Прекъснато свързване: Сегментите на умения не се свързват естествено заедно.
- Шумно: Физически невъзможни или неточни състояния нарушават обучението.
Вместо да събира по-чисти данни, екипът твърди, че на теория съществуват безкрайни физически валидни траектории около несъвършените данни – достатъчно, за да се преодолеят уменията и да се даде възможност за непрекъснато, стабилно обучение.

За да отключат този потенциал, те предлагат три ключови стъпки:
Сглобена графика на траекторията (STG)
Методът идентифицира сходни състояния в различни траектории на умения (напр. между дрибъл и layup). След това ги свързва, създавайки графика, която отключва преходи, които никога не се виждат в необработените данни.
Поле за преход на състоянието (STF)
По време на обучението роботът започва от произволно избрани близки състояния, а не от фиксирани точки. Маскираните междинни състояния служат като „времеви буфери“, натискайки политиката да научи поведения за възстановяване.
Адаптивно траекторно вземане на проби (ATS)
Сегментите с по-твърда траектория се вземат по-често, предотвратявайки откази на дълги вериги. Тези нововъведения позволяват преминаване на умения и устойчивост далеч над това, което обикновено позволяват оскъдните, шумни данни. При симулация (Isaac Gym) роботът може да изпълнява подреждания дори при смущения и плавен преход между дрибъл и стрелба.
В сравнение с предишния метод SOTA SkillMimic, SkillMimic-V2 повишава процента на успеваемост при слагане от 0% до 91,5%, а процентите на успешен преход от 2,1% до 94,9%.

SkillMimic (CVPR 2025 Акцент)

SkillMimic – предшественикът на V2 – беше приет като акцент на CVPR 2025. Той въведе унифициран механизъм за имитация и възнаграждение и йерархична рамка за обучение, способна да обучава роботите на различни умения за взаимодействие човек-обект (HOI), включително баскетболни действия като дрибъл, подреждания и стрелба.

Архитектурата му включва:
- Унифицирана награда за имитация на HOI за усвояване на всички умения без ръчно изработени награди, специфични за уменията.
- Йерархична структура, при която политиките на ниско ниво усвояват умения за взаимодействие, а контролерът на високо ниво ги съставя за сложни многоетапни задачи.
- Мащабни набори от данни (BallPlay-V & BallPlay-M), събиращи около 35 минути реални баскетболни взаимодействия.

В сравнение с DeepMimic и AMP, SkillMimic значително подобрява нивата на успеваемост в баскетболните умения и поддържа контрол с дълъг хоризонт, включително дриблиране около конуси и комбиниране на движения.
PhysHOI (2023)
Поглеждайки назад към основите на изследователската линия SkillMimic, документът на екипа от 2023 г. PhysHOI: Базирана на физика имитация на динамично взаимодействие човек-обект отбеляза ранен опит за обучение на роботи на баскетболни умения в симулация. Работата въведе основана на физиката рамка за обучение по имитация, предназначена да улови динамични взаимодействия човек-обект (HOI).

По същество PhysHOI захранва както текущото симулирано състояние на HOI, така и съответната референтна демонстрация в модел на политика.

След това политиката извежда действие, което се изпълнява във физически симулатор, за да генерира следващото симулирано състояние. Комбинация от кинематични награди и награди за контакт-хващане (CG) ръководи оптимизацията, насърчавайки политиката да увеличи максимално очакваната производителност. Чрез повторение на този цикъл до конвергенция, роботът се научава да възпроизвежда поведението на HOI, демонстрирано в набора от данни.

Експериментите показаха, че PhysHOI може стабилно да се справя с баскетболни манипулации, дори когато размерът на топката варира, полагайки основата за по-късен напредък в уменията за робот баскетбол в реалния свят.

Още нещо

Ключов изследовател зад PhysHOI, SkillMimic и SkillMimic-V2 е Yinhui Wang, сега широко наричан онлайн „изследовател №1 в света на баскетбола“. Уанг е втора година докторант в HKUST при проф. Peng Tan, с предишно обучение в Пекинския университет и Xi’an Electronic Science and Technology University, плюс стажове в IDEA Research, Unitree и Shanghai AI Lab.
От ранните симулации през 2023 г. до демонстрациите на баскетбол в реалния свят през 2025 г., напредъкът се ускори бързо – и с хардуер като Unitree G1, който се развива бързо, скокът от изследвания към физическа производителност се случва с безпрецедентна скорост.
Нашия източник е Българо-Китайска Търговско-промишлена палaта



