Исследователи опубликовали свои выводы в журнале Nature Machine Intelligence ( «Как LLM могут преобразовать процесс проектирования роботов?» ).
Каковы самые большие будущие проблемы для человечества? Это был первый вопрос, который Козимо Делла Сантина, доцент и аспирант Франческо Стелла из TU Delft, и Джози Хьюз из EPFL задали ChatGPT. «Мы хотели, чтобы ChatGPT разработал не просто робота, а действительно полезного робота», — говорит Делла Сантина. В конце концов, своей задачей они выбрали снабжение продовольствием, и в чате с ChatGPT им пришла в голову идея создать робота для сбора помидоров.
Рука робота-сборщика помидоров, разработанная ChatGPT и исследователями из TU Delft и EPFL, «смотрит» в камеру. (Изображение: Adrien Buttier / EPFL)
Полезные предложения
Исследователи следовали всем дизайнерским решениям ChatGPT. По словам Стелла, вклад ИИ оказался особенно ценным на концептуальной стадии. «ChatGPT смог расширить знания дизайнера в других областях. Например, чат-робот научил нас, автоматизация какой культуры будет наиболее выгодной с экономической точки зрения». Но ChatGPT также выдвинул и полезные предложения на этапе реализации: «Сделайте захват из силикона или резины, чтобы не раздавить помидоры» и сразу же предложил «Двигатель Dynamixel — как лучший способ управлять роботом». Результатом этого партнерства между людьми и ИИ стала роботизированная рука, которая может собирать помидоры.
ChatGPT как исследователь
Исследователи обнаружили, что совместный процесс проектирования был положительным и обогащающим. «Однако мы обнаружили, что наша роль инженеров сместилась в сторону выполнения более технических задач», — говорит Стелла. В Nature Machine Intelligence исследователи изучают различные степени сотрудничества между людьми и большими языковыми моделями (LLM), одной из которых является ChatGPT.
Большие языковые модели — это нейросетевые модели, использующие алгоритмы машинного обучения, позволяющие обобщать, прогнозировать, генерировать человеческие языки на основе больших наборов текстовых данных. Принцип работы таких моделей основан на определении вероятностного сочетания слов и их значений в заданном контексте с использованием определенных алгоритмов вычислений.
В самом экстремальном сценарии ИИ обеспечивает все входные данные для конструкции робота, а человек слепо следует за ним. В этом случае LLM выступает в роли исследователя и инженера, а человек выступает в роли менеджера, отвечающего за определение целей проектирования.
Риск дезинформации
Такой экстремальный сценарий еще невозможен с сегодняшними LLM. И вопрос в том, желательно ли это. «На самом деле, результаты LLM могут вводить в заблуждение, если они не проверены или не утверждены. Боты с искусственным интеллектом предназначены для получения «наиболее вероятного» ответа на вопрос, поэтому существует риск дезинформации и предвзятости в области робототехники», — говорит Делла Сантина. Работа с LLM также поднимает другие важные вопросы, такие как плагиат, отслеживаемость и интеллектуальная собственность.
Делла Сантина, Стелла и Хьюз продолжат использовать робота для сбора помидоров в своих исследованиях робототехники. Они также продолжают изучение LLM для разработки новых роботов. В частности, они рассматривают автономию ИИ в разработке собственных тел. «В конечном счете, открытым вопросом для будущего нашей области является то, как можно использовать LLM для помощи разработчикам роботов, не ограничивая творческий потенциал и инновации, необходимые для того, чтобы робототехника могла справиться с задачами 21-го века», — заключает Стелла.