[IT 알아보기]/IT 소식

[IT 소식] "오픈AI '소라'보다 낫다"…동영상 생성 AI 강자 런웨이, 新무기 공개

이호스트ICT 2024. 6. 20. 14:30

"오픈AI '소라'보다 낫다"…동영상 생성 AI 강자 런웨이, 新무기 공개

런웨이, '젠-3 알파' 출시…'클링·드림머신' 등 '소라'보다 퀄리티 우수한 모델 쏟아져

 
 
  •  

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 런웨이가 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다.

19일 테크레이더, 벤처비트 등 외신에 따르면 런웨이는 지난 17일 동영상 생성 AI 모델 '젠-3 알파(Zen-3 Alpha)'를 공개했다. 미국 스타트업 루마 AI가 '드림 머신'을 공개한 지 일주일 만이다.

런웨이는 지난해 3월 본격적인 동영상 생성 AI 모델이라 할 수 있는 '젠-1(Gen-1)'을 출시했다. 프롬프트를 입력하거나 특정 이미지를 참조해 기존 영상을 새로운 영상으로 변환할 수 있는 모델이다. 또 한 달 뒤인 같은 해 3월에는 기존 모델을 '멀티모달' 기능으로 업그레이드한 '젠-2(Gen-2)'를 출시했다. '젠-1'에서 영상을 만들 때 원본 영상이 꼭 필요했다면 '젠-2'에서는 텍스트만으로도 영상을 만들어낼 수 있다.

(영상=런웨이)

'텍스트 투 비디오'의 경우 2022년 메타나 구글이 이미 기술을 시연한 적 있다. 하지만 일반인들이 사용할 수 있게 프로그램을 풀지 않은 것과 달리 런웨이는 구독자들이 사용할 수 있도록 상용화해 서비스를 제공하고 있다.

'젠-3 알파'도 텍스트 프롬프트, 정지 이미지 또는 사전 녹화된 비디오를 프롬프트로 사용한다. 이를 통해 다양한 감정 표현 및 카메라 움직임을 통해 10초 길이의 고품질의 매우 상세하고 사실적인 장면을 90초 안에 생성할 수 있다. 전작에 비해선 생성 속도, 충실도가 대폭 향상됐을 뿐만 아니라 생성 동영상의 구조, 스타일 및 모션 등을 세밀하게 제어할 수도 있다.

런웨이는 지난 2월 오픈AI '소라' 출시 당시 "게임은 시작됐다"라고 전면전을 선언해 주목 받은 바 있다. 이날 '젠-3 알파'를 통해 만든 영상을 확인한 이들은 완성도가 높아 런웨이의 자신감이 과장이 아니라고 평가했다. 특히 영화처럼 연출 장면은 좋은 반응을 얻었다.

런웨이는 '젠-3 알파'를 이번 주말쯤 유료 사용자에게 정식 공개할 예정이다. 현재는 월 12달러에 유료로 이용할 수 있다. 런웨이는 이후 무료 사용자에게도 점차 서비스를 확대한다는 방침이다.

이처럼 최근 등장한 고퀼리티 동영상 생성 AI 중 정식 서비스를 시작하는 것은 런웨이가 처음이다. 

런웨이는 "공개된 모든 영상은 수정 없이 '젠-3 알파'로 모두 제작됐다"며 "대규모 멀티모달 훈련을 위해 구축된 새로운 인프라에서 만들어진 첫 번째 모델"이라고 설명했다. 

런웨이는 주요 엔터테인먼트 및 미디어 기업들과 제휴를 노리고 '젠-3'의 맞춤형 버전도 제작했다. 이 버전은 제작자의 예술적 의도에 맞춰 일관된 비디오를 생성하도록 한다. 또 생성된 캐릭터, 배경 및 요소들이 다양한 장면에서 일관된 외모와 행동을 유지할 수 있는 것이 특징이다. 

런웨이는 "조만간 이 기술이 적용된 광고, 쇼트 비디오 등을 만나볼 수 있을 것으로 기대한다"며 "젠-3알파는 새로운 C2PA(콘텐츠 자격 증명) 출처 표준을 포함한 보호 장치와 함께 출시될 예정"이라고 밝혔다.

(영상=런웨이)

런웨이 외에도 최근 여러 스타트업들이 동영상 생성 AI 모델을 잇따라 출시하며 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 지난달 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신' 등이 공개됐다.  

앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 메타가 '에뮤' 동영상 생성기를 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 미드저니는 조만간 비디오 모델을 내놓을 것으로 알려졌다.

업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기쯤 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

장유미 기자sweet@zdnet.co.kr

https://zdnet.co.kr/view/?no=20240619094147