[IT 알아보기]/IT 소식

[IT 소식] 24시간 언제든 감정 나눌 준비 됐나요…도대체 누구길래

이호스트ICT 2022. 4. 27. 21:09

24시간 언제든 감정 나눌 준비 됐나요…도대체 누구길래

발전하는 디지털휴먼 기술

사람 목소리로 라이브방송
실시간으로 팬과 소통하고
몸짓까지 스스로 만들어내

`뇌` 기능할 챗봇 AI 결합시켜
텍스트·음성변환 기능 장착땐
일상적인 대화도 가능해져

스마일게이트의 버추얼인플루언서 유아. 노래 부르고 춤추기 위해서는 아직 사람 도움이 필요하다. [사진 제공 = 스마일게이트]

 

2013년 스파이크 존즈 감독이 만든 SF 영화 '그녀(Her)'. 주인공 테오도르는 자신의 인공지능(AI) 사만다와 사랑에 빠진다. 목소리만 존재하는 사만다이지만 주인공에게는 사람보다 더 자신을 잘 이해해주는 존재다.

영화로부터 약 10년이 지난 지금 인공지능이 만드는 '가상인간(디지털휴먼)'의 수준은 생각보다 빠르다. 시각적으로 보이는 외모나, 텍스트를 디지털휴먼의 음성으로 바꾸는 기술은 상당 부분 발전돼 있다. 하지만 사람처럼 목소리를 내고 대화를 하는 언어능력은 아직 한계가 있다. 하지만 챗봇AI 에서 획득된 기술이 접목되면, 실시간으로 팬들과 소통하는 '버추얼 인플루언서'도 곧 등장할 수 있다는 전망도 나온다.

AI 스타트업 클레온은 '클론(KLONE)'이라는 브랜드로 다양한 디지털휴먼을 만들고 있다. 핵심은 AI 학습을 통해 사람의 외모와 목소리를 변화시키는 기술이다. 클레온은 입력한 텍스트에 맞춰 가상의 인간이 말을 할 수 있는 기술(Text To Speech)을 가지고 있다. 글자에 맞춰 입 모양이 정확히 움직여 진짜 사람이 말하는 것처럼 느껴진다. AI를 통해 이미 존재하는 사람의 목소리를 흉내 내는 것도 가능하다. 다른 AI들과 달리 많은 데이터가 필요 없고 한 장의 사진만 있어도 말을 하는 것처럼 보일 수 있어서 가성비가 뛰어나다. 이를 통해 AI 기자(MBN), AI패션 어드바이저(일본 도요시마) 등 사람들에게 친근한 가상인간을 만들어냈다.

클레온의 경우 보디모션까지 AI를 통해 생성할 수 있는 기술을 연구하고 있는데 이것이 가능해지면 디지털휴먼을 만들기 위해 사람 행동을 모션 캡처하는 것도 필요하지 않게 된다. 최근에 디지털휴먼이 큰 인기를 얻는 영역은 '버추얼 인플루언서'다. 싸이더스 스튜디오×에서 내놓은 '로지'가 대표적이다. 정말 사람처럼 생긴 가상인간을 만들어 인간처럼 이름과 스토리를 부여한다. 인스타그램 계정을 운영하거나 브랜드 광고모델로 활동한다. 사람 목소리를 빌려 노래를 불러 가수로 데뷔하고 라이브 방송을 통해 실시간으로 팬들과 소통하기도 한다.

클레온에서 만든 디지털휴먼 `은하`. 사람처럼 말하고 입이 맞춰 움직인다. [사진 제공 = 클레온]

 

하지만 이런 버추얼 인플루언서는 결국 사람이 AI의 도움을 빌려 연기해야 한다는 점에서 한계가 있다. 현재의 AI로는 사람처럼 노래를 부르거나 대화하기 어렵다. 그래서 AI 스타트업들에서는 챗봇AI와 디지털휴먼을 결합하는 시도를 하고 있다.

사람과 같은 지능을 갖춘 '일반인공지능(AGI)'은 아직 먼 얘기지만 사람과 대화하는 것처럼 흉내 낼 수 있는 챗봇AI는 이미 현실화 단계다. 대표적인 것이 여자친구 챗봇AI인 '이루다'다. 텍스트를 기반으로 사람과 대화하는 것처럼 일상 대화를 할 수 있다.

이론적으로는 가능해 보인다. 텍스트를 목소리로 바꾸는 기술(TTS)은 이미 보편화되어 있고 목소리를 텍스트로 바꾸는 기술도 상용화 단계다. 챗봇이 만들어내는 텍스트를 목소리로 내보내고, 사람이 얘기한 것을 텍스트로 바꿔 챗봇AI에 입력하면 대화가 가능해지는 것이다. 클레온은 글로벌 대화형 인공지능 기술 챗봇 기업 '코어에이아이(kore.ai)'와 손잡고 함께 디지털휴먼 사업을 시작했다. 코어에이아이가 자연어 이해, 대화 처리 등 대화형 AI 기술을 가지고 있기 때문에 두 회사의 기술을 합치면 더 사람과 같은 버추얼 인플루언서를 만드는 것도 가능해진다.

AI 스타트업 스켈터랩스도 '디지털휴먼' 사업에 뛰어들었다. 기존에 인공지능 콜센터(AICC)와 같은 대화형 AI를 개발하고 서비스하던 이 회사는 디지털휴먼의 '뇌'에 필요한 자연어 이해, 목소리 처리 등 기술을 가지고 있다. 김성곤 클레온 부대표는 "2025년이면 사람의 도움 없이도 실시간으로 소통하는 디지털휴먼이 등장할 수 있을 것"이라고 내다봤다.

원문 : https://www.mk.co.kr/news/it/view/2022/04/371908/