Калифорнийский университет в Беркли внедряет ускоренное обучение, которое запускает роботов за считанные минуты

Роботы, использующие ИИ для изучения новой задачи, обычно требуют трудоемкого и повторяющегося процесса обучения. Исследователи из Калифорнийского университета в Беркли пытаются упростить и сократить этот процесс с помощью инновационной методики обучения, которая позволяет роботу заполнять пробелы, а не начинать с нуля.

Команда поделилась с TechCrunch несколькими рабочими потоками, чтобы представить их сегодня на сессиях TC: Robotics, и в видео ниже вы можете услышать о них — сначала от Стивена Джеймса, исследователя из Калифорнийского университета в Беркли.

"Техника, которую мы используем, представляет собой своего рода контрастную настройку обучения, когда она берет видео с YouTube и исправляет ряд областей, а идея состоит в том, что затем робот пытается реконструировать это изображение", – пояснил Джеймс. «Он должен понять, что может быть в этих пятнах, чтобы затем сгенерировать идею о том, что может скрываться за этим; он должен иметь очень хорошее представление о том, что происходит в мире. »

Конечно, он не учится, просто просматривая YouTube, как это распространено в человеческом мире. Операторы должны перемещать самого робота либо физически, либо с помощью контроллера виртуальной реальности, чтобы дать ему общее представление о том, что он пытается сделать. Он сочетает эту информацию со своим более широким пониманием мира, почерпнутым из видеозаписей, и может при желании использовать многие другие источники.

Этот подход уже дает результаты, сказал Джеймс: "Обычно иногда для выполнения новой задачи требуются сотни демонстраций, тогда как теперь мы можем предоставить несколько демонстраций, может быть, 10, и это может решить задачу".

Изображение предоставлено TechCrunch

Алехандро Эсконтрела специализируется на разработке моделей, которые извлекают важные данные из видео на YouTube, например движения животных, людей или других роботов. Робот использует эти паттерны, чтобы информировать о своем поведении, оценивая, похоже ли данное движение на то, что ему следует попробовать.

В конечном итоге он пытается воспроизвести движения видео, чтобы другая модель, смотрящая их, не могла сказать, гоняется ли за мячом робот или настоящая немецкая овчарка.

Интересно, что многие подобные роботы сначала учатся в среде моделирования, по сути проверяя движения в виртуальной реальности. Но, как объясняет Данияр Хафнер, процессы стали достаточно эффективными, чтобы можно было пропустить этот тест, позволив роботу резвиться в реальном мире и учиться вживую на таких взаимодействиях, как ходьба, спотыкание и, конечно же, толчки. Преимущество здесь в том, что он может учиться во время работы, а не возвращаться к симулятору, чтобы получить новую информацию, что еще больше упрощает работу.

"Я думаю, что святой Грааль обучения роботов – научиться как можно большему в реальном мире и как можно быстрее – – сказал Хафнер. – Они определенно идут к этой цели. Посмотрите полное видео о работе команды здесь.

Технологии Jul 21, 2022 0 53 Add to Reading List

Калифорнийский университет в Беркли внедряет ускоренное обучение, которое запускает роботов за считанные минуты

Роботы, использующие ИИ для изучения новой задачи, обычно требуют трудоемкого и повторяющегося процесса обучения. Исследователи из Калифорнийского университета в Беркли пытаются упростить и сократить этот процесс с помощью инновационной методики обучения, которая позволяет роботу заполнять пробелы, а не начинать с нуля.

Команда поделилась с TechCrunch несколькими рабочими потоками, чтобы представить их сегодня на сессиях TC: Robotics, и в видео ниже вы можете услышать о них — сначала от Стивена Джеймса, исследователя из Калифорнийского университета в Беркли.

"Техника, которую мы используем, представляет собой своего рода контрастную настройку обучения, когда она берет видео с YouTube и исправляет ряд областей, а идея состоит в том, что затем робот пытается реконструировать это изображение", – пояснил Джеймс. «Он должен понять, что может быть в этих пятнах, чтобы затем сгенерировать идею о том, что может скрываться за этим; он должен иметь очень хорошее представление о том, что происходит в мире. »

Конечно, он не учится, просто просматривая YouTube, как это распространено в человеческом мире. Операторы должны перемещать самого робота либо физически, либо с помощью контроллера виртуальной реальности, чтобы дать ему общее представление о том, что он пытается сделать. Он сочетает эту информацию со своим более широким пониманием мира, почерпнутым из видеозаписей, и может при желании использовать многие другие источники.

Этот подход уже дает результаты, сказал Джеймс: "Обычно иногда для выполнения новой задачи требуются сотни демонстраций, тогда как теперь мы можем предоставить несколько демонстраций, может быть, 10, и это может решить задачу".

Изображение предоставлено TechCrunch

Алехандро Эсконтрела специализируется на разработке моделей, которые извлекают важные данные из видео на YouTube, например движения животных, людей или других роботов. Робот использует эти паттерны, чтобы информировать о своем поведении, оценивая, похоже ли данное движение на то, что ему следует попробовать.

В конечном итоге он пытается воспроизвести движения видео, чтобы другая модель, смотрящая их, не могла сказать, гоняется ли за мячом робот или настоящая немецкая овчарка.

Интересно, что многие подобные роботы сначала учатся в среде моделирования, по сути проверяя движения в виртуальной реальности. Но, как объясняет Данияр Хафнер, процессы стали достаточно эффективными, чтобы можно было пропустить этот тест, позволив роботу резвиться в реальном мире и учиться вживую на таких взаимодействиях, как ходьба, спотыкание и, конечно же, толчки. Преимущество здесь в том, что он может учиться во время работы, а не возвращаться к симулятору, чтобы получить новую информацию, что еще больше упрощает работу.

"Я думаю, что святой Грааль обучения роботов – научиться как можно большему в реальном мире и как можно быстрее – – сказал Хафнер. – Они определенно идут к этой цели. Посмотрите полное видео о работе команды здесь.