[IT 알아보기]/IT 소식

[IT 소식] 오픈AI, AGI 개발 돌파구 찾았다...인간처럼 추론하는 LLM '큐스타' 개발 중

이호스트ICT 2023. 11. 27. 10:21

알트먼 해임 전후 사정 맞아 떨어져

오픈AI가 인공일반지능(AGI)에 도달할 기술을 개발했으며, 샘 알트먼 CEO는 공식 석상에서 이를 언급한 것으로 알려졌다. 그리고 하루 뒤에 알트먼은 해임됐다.

디 인포메이션과 로이터는 22일(현지시간) 내부 소식통을 인용해 오픈AI가 AGI 개발의 돌파구를 발견했으며, 이런 소식이 이사회에 알려지며 알트먼 해임에 영향을 미쳤다고 보도했다.

이에 따르면 알트먼은 오픈AI 이사회로부터 해고 통보를 받기 하루 전인 16일 아시아 태평양 경제협력체(APEC) CEO 서밋에 참가, "오픈AI 사상 4번의 중요한 순간 중 하나가 몇주전 찾아왔다"라며 "무지의 베일을 걷어내고 발견의 최전선을 앞으로 당기는" 중요한 발견을 했다고 언급했다. 이는 6일 '데브데이' 이후 차세대 모델에 대한 언급이 부쩍 늘어난 것과도 일치한다.

이 발언은 다음 날 해고 사태로 인해 거의 눈에 띄지 않았으나, 일부 오픈AI 직원들은 회사가 강력한 AI 모델을 개발할 혁신을 언급한 것으로 이해했다고 전해졌다.

실제 오픈AI는 일리아 수츠케버 수석 과학자의 주도로 올 초 기술적인 혁신을 이룬 것으로 알려졌다. 이는 수츠케버가 수년간 집중했던 'GPT-제로(Zero)'라는 프로젝트가 바탕이 된 것으로 알려졌다.

그는 수년 동안 LLM의 약점으로 꼽히던 수학이나 과학 추론을 해결할 방법을 연구, 2021년 트랜스포머' 논문 저자 중 하나인 루카스 카이저와 프로젝트를 진행했다. 이들의 연구는 2022년 11월에 등장한 '테스트-시간 계산(test-time computation)'이라는 기계 학습 개념이 핵심으로, LLM의 성능을 개선하기 위해서는 더 많은 시간과 컴퓨팅 파워를 제공하는 네트워크를 설계해야 한다는 내용이다.

test-time computation의 근거가 된 2022년 논문 (사진=arXiv)

이를 바탕으로 오픈AI는 '코드 생성' 팀과 '수학 생성' 팀을 결합한 새 조직을 구성, 얼마전 'Q스타(Q*)'라는 모델을 구축했다. 이 모델은 이제까지 LLM의 한계였던 일부 수학 문제를 해결하는 데 성공한 것으로 알려졌다. 

문제는 초등학생 과정에 불과하지만, 오픈AI는 Q스타가 AGI의 돌파구를 마련했다며 흥분한 것으로 전해졌다.

수학은 생성 AI 개발의 중요한 극복 과제다. 현재 생성 AI는 같은 질문을 해도 답변이 크게 달라지는 등 확률에 의존하고 있다. 하지만 정답이 하나뿐인 수학 능력을 정복한다는 것은 AI가 '학습하고 이해하고 일반화하는' 인간 지능과 유사한 추론 능력을 갖춘다는 것을 의미하기 때문이다. 

이에 앞서 오픈AI는 '아라키스'라고 알려진 AGI 프로젝트를 진행했으나, 성능 미달로 여름쯤 이를 폐기한 것으로 알려졌다. 즉 시행착오를 바탕으로, 결국 9~10월경에는 테스트에 성공한 것으로 추정할 수 있다. 그리고 이 모델의 고도화에 엄청난 비용이 필요하자, 알트먼은 회사 주식을 매각하면서까지 자금 확보에 애를 썼다.

이 과정을 거치며 수츠케버는 내부에 AGI 위협에 대비하는 전담팀을 만들었고, 알트먼과 갈등을 일으켰다. 또 미라 무라티 CTO는 이 문제에 대해 함구하라는 방침을 내부에 전했다.

하지만 일부 연구원이 이사회에 편지를 보내 "인류를 위협할 수 있는 강력한 AI를 발견했다"라고 경고한 것으로 알려졌다.

이후 이사회는 "소통이 솔직하지 않다"라며 알트먼을 해임했으며, 이어 그렉 브록먼 회장과 제커브 파초키와 시몬 사이도 , 알렉산더 매드리 등 3명의 수석 연구자 3명이 회사를 떠났다.

파초키와 사이도는 수츠케버의 연구를 바탕으로 큐스타를 구축한 핵심 인원이다. 매드리는 큐스타의 가드레일을 개발하기 위해 MIT에서 영입한 인물로, 수츠케버를 건너뛰고 무라티에게 직접 보고를 진행해 왔다. 

이들은 알트먼의 복귀와 함께 모두 오픈AI로 돌아왔다.

이에 대해 오픈AI는 공식적인 답변을 내놓지 않았다.

임대준 기자 ydj@aitimes.com

원문: https://www.aitimes.com/news/articleView.html?idxno=155433