Компания Google DeepMind анонсировала две новые модели искусственного интеллекта (ИИ), которые значительно расширяют возможности взаимодействия роботов с физическим миром. Эти инновационные разработки обещают улучшить точность и эффективность выполнения задач роботами в реальном времени.
Новая модель Gemini Robotics
Первая из представленных моделей, Gemini Robotics, основана на технологии «зрение-язык-действие» (Vision-Language-Action, VLA). Эта система позволяет роботам воспринимать окружающую среду, понимать команды на естественном языке и выполнять сложные действия. Благодаря многоязычной поддержке, Gemini Robotics значительно упрощает взаимодействие с роботами в различных средах и культурах.
Расширенные возможности с Gemini Robotics-ER
Вторая модель, Gemini Robotics-ER, представляет собой усовершенствованную систему, способную не только интерпретировать сложные сценарии, но и адаптировать движения робота в реальном времени. Это делает её особенно полезной в динамичных условиях, таких как склады, медицинские учреждения или даже дома.
Прорыв в сфере робототехники
Обе модели основаны на возможностях флагманской платформы Gemini 2.0, что позволило значительно улучшить алгоритмы принятия решений и повысить точность управления роботами. Данная разработка представляет собой важный шаг в создании более интеллектуальных и автономных роботов.
Специалисты отмечают, что внедрение подобных технологий откроет новые горизонты для применения роботов в повседневной жизни, промышленности и медицине. Ожидается, что новые системы найдут широкое применение в ближайшие годы.