인공지능이 로봇도 제어한다...MS, '챗GPT'로 로봇 제어 연구
사람의 명령을 로봇 언어로 코딩해 전달하고 피드백 관리...
프롬프트 전략 공유할 협업 오픈소스 플랫폼 ‘프롬프트크래프트’도 출시
인공지능(AI)가 사용자 명령에 따라 로봇을 제어하는 시대가 성큼 다가왔다. 영화 '아이언맨'에 등장하는 인공지능 '자비스'가 현실화될 시기가 멀지 않았다.
이미 이를 위한 연구가 한창이다. 마이크로소프트(MS)는 최근 블로그에 ‘챗GPT’를 사용해 로봇을 제어하는 연구 수행 결과를 발표했다. 사람이 로봇에게 말로 명령을 내리면 챗GPT가 이를 로봇 언어로 코딩해 전달하는 등 중간에서 로봇을 제어하도록 하는 방법을 실험한 연구다.
지금까지의 로봇 공학은 엔지니어가 로봇의 언어로 코딩해 명령을 입력하고 로봇의 피드백을 관찰해 수정하는 작업을 반복하는 수준이었다.
반면 이번 MS의 연구는 엔지니어가 사람의 언어로 명령하면 챗GPT가 이를 로봇용 코드로 변환해 로봇에 명령을 전달하고 관찰해 피드백을 제공하는 모든 역할을 대신한다.
MS는 이를 위해 챗GPT에 로봇별 API를 가르쳤다. 챗GPT는 자연어 명령을 로봇 API를 활용해 로봇 움직임을 제어하는 특수 코드를 작성한다. 이를테면 ‘공 집어들기’를 지시하면 챗GPT는 시를 쓰거나 에세이를 완성하는 것처럼 로봇 제어 코드를 생성한 뒤 로봇이 작업을 성공할 때까지 코드를 검사하고 수정하는 작업을 실행한다.
이번 연구에서는 로봇 팔을 사용해 MS 로고에 블록을 배열하거나 드론을 날려 선반의 내용물을 검사하거나 로봇을 사용해 비전 기능으로 물체를 찾는 등 인간의 지시에 따라 챗GPT가 작성한 코드로 제어하는 로봇을 보여준다.
MS는 시행 착오 끝에 로봇 작업에 대한 프롬프트를 작성하기 위한 방법론과 일련의 디자인 원칙을 구축했다.
먼저 고급 로봇 API 또는 함수 라이브러리 세트를 정의한다. 이 라이브러리는 특정 로봇에 고유할 수 있으며 로봇의 제어 스택 또는 인식 라이브러리의 기존 하위 수준 구현에 매핑해야 한다. 챗GPT가 해당 동작에 대해 추론할 수 있도록 상위 수준 API에 설명이 포함된 이름을 사용하는 것이 매우 중요하다.
다음으로 작업 목표를 설명하는 챗GPT용 텍스트 프롬프트를 작성하는 동시에 상위 수준 라이브러리에서 어떤 기능을 사용할 수 있는지 명시적으로 설명한다. 프롬프트에는 작업 제한에 대한 정보 또는 챗GPT가 응답을 구성하는 방법도 포함될 수 있다.
사용자는 직접 검사 또는 시뮬레이터를 사용해 챗GPT의 코드 출력을 평가한다. 필요한 경우 사용자는 자연어를 사용해 답변의 품질과 안전성에 대한 피드백을 챗GPT에 제공한다.
마지막으로 사용자가 솔루션에 만족하면 최종 코드를 로봇에 배포할 수 있다.
MS는 이 연구를 토대로 사용자가 다양한 로봇 범주에 대한 프롬프트 전략을 공유할 수 있는 협업 오픈 소스 플랫폼인 ‘프롬프트크래프트(PromptCraft)’를 출시했다. 여기에는 MS가 연구에 사용한 모든 프롬프트와 대화를 포함했다.
MS 는 이후 로봇 시뮬레이터와 인터페이스를 추가해 챗GPT에서 생성한 알고리즘을 테스트할 계획이다.
박찬 위원 cpark@aitimes.com
원문 : https://www.aitimes.com/news/articleView.html?idxno=149737
'[IT 알아보기] > IT 소식' 카테고리의 다른 글
[IT 소식] MS, 멀티모달 대규모 언어 모델 ‘코스모스-1’ 공개 (0) | 2023.03.06 |
---|---|
[IT 소식] 메타버스 기업 더샌드박스, 독일 게임사 스바이퍼 인수 (0) | 2023.03.04 |
[IT 소식] SK텔레콤 '에이닷', 친구와 소통하듯 진화 (0) | 2023.03.03 |
[IT 소식] '책임 있는 AI' 제작·활용 가이드라인 나왔다...오픈AI도 참여 (0) | 2023.03.02 |
[IT 소식] 로블록스, 생성형 AI 도구 구현 위한 비전 공개 (0) | 2023.02.28 |