[IT 알아보기]/IT 소식

[IT 소식] 글 넘어 그림 그리는 생성 AI ‘칼로’... 카카오브레인, API·체험판 동시 공개

이호스트ICT 2023. 1. 10. 07:40



글 넘어 그림 그리는 생성 AI ‘칼로’... 카카오브레인, API·체험판 동시 공개


데이터셋 확장 학습과 편집·변환 기능 추가해 활용성 높여, 체험판으로 ‘칼로’의 이미지 생성·편집·변환 기능 무료 사용...신규 브랜드 로고나 포스터 디자인 또는 새로운 작품을 만들어내야 할 때 영감을 얻는 도구로도 활용 가능

Karlo가 구현한 토끼 이미지(사진:카카오)



지난해 인공지능에서 가장 큰 발전과 이슈는 '생성AI(Generative AI)'를 꼽는다. 챗GPT(ChatGPT), 달리(DALL-E 2) 등과 같은 대규모 언어 모델을 출시하며 관련 커뮤니티를 뜨겁게 달궜다. 

스탠퍼드대학교(Stanford University) 인간중심인공지능연구소(Human-Centered Artificial Intelligence. HAI) 등 글로벌 대표적인 AI 연구기관 및 조사기관들은 올해 인공지능에서 가장 큰 이슈로 '생성 AI'를 꼽는다.

초거대 AI 기술을 활용해 세상에 단 하나뿐인 글과 이미지를 손쉽게 생성, 편집, 변환할 수 있게 됐다.

국내 역시 카카오브레인(대표 김일두)은 지난해 12월 멀티모달 초거대 인공지능 모델 ‘minDALL-E’ 를 비롯한 ‘RQ-Transformer’ 등 초거대 이미지 생성 AI 모델을 발전시켜 글 넘어 입력 제시어로 빠르게 고품질 이미지 만드는 하나의 페르소나로 재탄생한 AI 아티스트 ‘칼로 1.0’ 오픈소스로 공개했었다.

여기에 카카오브레인은 9일 ‘카카오디벨로퍼스’에서 카카오브레인의 한층 더 발전된 AI 이미지 모델 ‘Karlo(이하 칼로)’를 API로 공개했다.


이미지:칼로 사이트 캡처



‘카카오디벨로퍼스’는 웹 서비스, 모바일 앱, 기타 응용 프로그램 개발에 필요한 플랫폼 및 카카오의 다양한 서비스와 연계할 수 있는 부가 기능을 제공하는 개발자 전용 웹사이트다. 

카카오의 AI 기술, 카카오톡 접점이 필요한 파트너나 개인 누구나 사용 가능하며 카카오 기술 혹은 무료 제공하는 오픈 API를 활용해 AI 서비스를 만들 수 있다. 현재 소셜통합, 비즈니스, 인공지능 등 다양한 분야에서 API를 제공 중이며 다양한 산업의 기업·단체·개인이 활용 중이다.

‘칼로 API’는 1.8억 장 규모로 확장된 텍스트-이미지 데이터셋을 학습하여, 이용자가 입력한 제시어의 내용을 이해한 후 다양한 화풍과 스타일로 세상에 단 하나뿐인 이미지를 생성하는 툴이다. 특히 생성한 이미지를 이용자의 의도에 따라 편집 및 변환하는 기능을 추가해 툴의 활용도를 높였다.


AI 칼로가 생성한 이미지 샘플(사진:카카오브레인)



고도의 창의력을 요하는 크리에이터, 디자이너, 예술 작가 등 창작 작업에 ‘칼로 API’를 다양하게 활용할 수 있다.

예를 들어 크리에이터가 “a black rabbit in the style of an oil painting(유화로 그린 검은 토끼)”라는 제시어를 입력하면 ‘칼로’가 제시어의 맥락을 이해하고 검은 토끼의 이미지를 유화 화풍으로 상상하여 그려낸다. 

이때 크리에이터는 생성한 이미지를 콘텐츠의 썸네일 이미지에 활용할 수 있다. 토끼 얼굴 영역을 선택하고 “a black rabbit with a crown(왕관을 쓴 검은 토끼)”라는 제시어를 추가 입력하면 해당 영역을 ‘칼로’가 편집해 화풍은 유지한 채 왕관을 쓴 검은 토끼 이미지로 재생성할 수도 있다.

신규 브랜드 로고나 포스터 디자인 또는 새로운 작품을 만들어내야 할 때 영감을 얻는 도구로도 활용 가능하다. 예를 들어, 작가가 생각하는 작품의 핵심 주제와 연관성이 높은 이미지를 업로드하면 ‘칼로’가 이를 기반으로 다양한 이미지를 생성한다. 이를 통해 작가는 아이디어를 얻어 독창적인 작품을 만들 수 있다.


칼로 시연 이미지



카카오브레인은 누구나 쉽게 ‘칼로 API’를 이용할 수 있는 체험판(보기)을 함께 공개했다. 매달 제공되는 이용 횟수 안에서 ‘칼로’의 다양한 기능을 사용할 수 있으며, 1회 당 최대 3장의 이미지를 생성·편집·변환할 수 있다. 

카카오브레인은 향후 추가적인 데이터셋 학습과 함께, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 ‘이미지 아웃페인팅(Image Outpainting)’ 등 다양한 기능을 추가하며 모델의 성능을 지속 고도화해 나갈 계획이다.

카카오브레인 김일두 대표는 “이번에 공개한 칼로 API 및 체험판을 통해 더 많은 사람들이 카카오브레인의 혁신적인 AI 이미지 생성 기술을 접할 수 있기를 바란다”며 “카카오브레인은 꾸준한 연구개발을 통해 칼로의 성능을 고도화하고 이를 다양한 형태로 공개하며 활용 범위를 꾸준히 확대할 것”이라고 말했다.

한편, ‘칼로 API(보기)’이용자는 추가 제휴를 통해 유료 API 사용이 가능하고 이용 건수 구간 및 약정 기간에 따른 할인 혜택도 받을 수 있다. 



출처 : 인공지능신문
최광민 기자 ckm0081@aitimes.kr
https://www.aitimes.kr/news/articleView.html?idxno=27075