[IT 알아보기]/IT 기본학습

[IT 기본학습] 이미지의 연금술사가 등장했다! 생성AI 기술의 키 포인트, 생성적 적대 신경망 (GAN)

이호스트ICT 2023. 5. 8. 17:44

 


이제는 우리의 일상 곳곳에 AI 기술들이 스며들어 있습니다. 아침에 일어나 하루를 시작하고 다시 하루를 마무리할 때까지 수 십 개의 기술들을 접하게 되는데요. 이제 인공지능은 사람을 돕는 단계를 넘어서 새로운 것을 만들어내는 예술가, 창작의 단계까지 수행하고 있습니다. 

 

주목할 만한 인공지능 기술을 꼽아보자면, 특히 '생성 AI'를 생각해 볼 수 있습니다. 입력된 데이터를 학습하여 새로운 것을 창작하는 인공지능을 생성 AI (Generative AI)라고 하는데요. 그림 그려주는 인공지능 모델, 목소리를 재현해 주는 인공지능 모델, 그리고 지금 가장 큰 관심을 받고 있는 텍스트 생성 인공지능 Chat GPT까지 모두 인공지능 생성 AI에 해당됩니다. 오늘은 이 창작 AI (Generative AI)에서 이미지 생성의 핵심이 되는 모델, GAN에 대해 알아보도록 하겠습니다. 


경쟁하며 학습한다! GAN

 

출처 : MIT 테크놀로지 리뷰


생성 AI(Generative AI)의 가장 중요한 점은 충분히 있을 법한, 진짜보다 더 진짜 같은 가짜를 생성하는 것입니다. 이를 잘 수행하기 위해서는 데이터의 분포가 중요한데요. 입력받은 데이터의 분포와 유사한 분포를 따르는 새로운 데이터를 생성하는 것입니다. 생성 AI 모델 중 GAN은 Generative Adversarial Networks의 약자로 생성적 적대 신경망을 의미합니다. 이름의 '적대'라는 말처럼 GAN은 서로 적대적인 관계의 두 요소로 학습이 이루어지는 것인데요.

 

GAN에는 생성자(Generator)와 판별자(Discriminator) 두 개의 모델이 있습니다. 생성자는 진짜 데이터와 같은 가짜 데이터를 만들어내는 역할을 하고 판별자는 입력된 데이터가 진짜 데이터인지 가짜 데이터인지 판별하는 역할을 합니다. 즉, 생성자의 목적은 판별자가 가짜를 진짜라고 생각하도록 하는 것이며,  판별자의 목적은 진짜와 가짜를 정확하게 구분하려고 하는 것이죠. 이렇듯 목적이 다른 적대적인 요소를 통해 서로 경쟁하며 학습하는 방식으로 이루어져 적대적 생성 신경망이라는 이름이 붙게 되었습니다. 

이 모델의 제안자인 이안 굿펠로(Ian Goodfellow)는 논문에서 GAN의 원리를 경찰과 위조지폐범이라고 예를 들어 설명했는데요. 생성자가 위조지폐범, 판별자를 경찰이라고 대입하였습니다. 위조지폐범이 위조지폐를 생성하면 경찰은 이 지폐의 진위 여부를 판별하여 범인을 검거해야 하는 것이죠. 이 과정이 반복되면 위조지폐범은 경찰을 속이지 못한 데이터를, 경찰은 위조지폐범에게 속은 데이터를 입력받아 적대적으로 학습하게 됩니다. 그 결과로 두 요소 모두 각자의 능력이 향상되고 결국 위조지폐범은 시간이 지날수록 진짜 지폐와 유사한 위조지폐를 만들게 되어 경찰이 구별할 수 없을 때까지 진행이 되는 것입니다. 즉, 이 과정이 반복되면서 위조지폐가 정교해지듯 점점 더 실제에 가까운 거짓 데이터를 생성하게 되는 것이죠.

 

GAN의 능력을 알아보자

GAN은 딥러닝을 통해서 이미지를 생성하거나 조합, 변형할 때 주로 쓰이는 모델로, 적은 양의 정보로 원본 이미지를 예측할 수도 있고 사진을 특정 스타일로 전환할 수도 있으며 자신이 학습한 데이터들을 바탕으로 진짜 같은 가짜인 새로운 이미지를 생성하는 것도 가능합니다. 

 

새로운 이미지를 생성해낸다

출처 : 인스타그램

 

생성 AI답게 학습된 데이터들을 바탕으로 새로운 결과물을 만들어낼 수 있는데요. 그 대표적인 예시로는 가상 인간, 버추얼 휴먼을 들 수 있습니다. 세상에 존재하지 않는 새로운 인물을 탄생시키는 기술로, 현시대에는 버추얼 휴먼이 노래도 하고 방송을 하기도 하며 기업의 전속 모델이 되기도 합니다. 

출처: 제너레이티드 포토스(Generated Photos)


버추얼 휴먼과 같은 맥락으로 새로운 사람들의 사진을 계속 생성해 내는 서비스도 있는데요. 제너레이티드 포토스(Generated Photos)는 GAN을 활용하며 10만 개의 얼굴 사진을 제공합니다. 비상업적 용도라면 누구나 무료로 사용할 수 있도록 했는데요. 사진들을 보면 정말 실존 인물의 사진처럼 생생하며 가짜라고 믿기지 않습니다. 그러나 이 역시 30,000장 이상의 사진들을 학습하고 재조합하여 실존하지 않는 인물의 사진을 새로 생성한 것입니다. 

 

무엇이든지 합성한다​

출처 : 엔비디아


GAN은 다양한 이미지를 합성할 수 있는데요. 이 능력을 활용해 엔비디아는 동물의 이미지를 비슷한 종의 개체에 적용하여 합성하는 GANimal을 출시했습니다. 이미지를 GANimal에 입력하면 이미지 번역 네트워크를 통해 기준 동물의 고유한 특성을 파악하고 입력한 이미지에 투영을 하게 되는데요. 이러한 합성기술로 미디어 콘텐츠는 물론 의료, 유통 등 여러 분야에서 활용이 되고 있습니다. 


세계적인 커머스 기업 아마존은 GAN의 합성 기술을 쇼핑 분야에도 적용했는데요. 딥러닝 알고리즘인 리스택GAN(ReStGAN)은 고객이 원하는 제품 이미지를 설명을 듣고 검색 범위를 좁혀 제품을 제시해 주고, 고객이 선택한 제품과 비슷한 제품을 추천하기도 하며, 선택한 제품을 모델에 입혀보는 온라인 피팅도 가능합니다. 

 

출처 : BBC NEWS

이미지의 합성뿐만 아니라 영상의 합성도 가능한데요. 2017년도에 미국 워싱턴 대학교 연구진이 만든 버락 오바마 전 미국 대통령의 가짜 영상이 큰 화제가 되었습니다. 오바마 전 대통령의 연설 영상들을 학습하여 음성을 따고 이 음성에 맞게 입 모양을 만들어내어 가짜 영상을 만드는데 성공한 것인데요. 현시대에는 인물의 목소리, 화법, 말투 등의 요소까지 학습하여 실제 사람의 음성으로 모든 말을 할 수 있는 단계까지 개발이 되었습니다. 이처럼 GAN은 이미지뿐 아니라 영상, 음성 합성에도 높은 활용도를 보이고 있습니다. 

 

 

이미지의 스타일을 바꾼다

고흐의 화풍을 적용한 광화문의 모습 (출처 : 딥드림)

 

모든 작품에는 스타일이 있고, 그 스타일 속에는 규칙이 존재하는데요. 이 특정 스타일의 규칙을 학습하여 다른 이미지들에 적용이 가능합니다. 같은 맥락으로 특정 작가의 화풍을 지속적으로 학습한다면 특정 작가의 화풍을 그대로 적용하여 새로운 이미지로 탄생시킬 수 있는데요. 구글이 만든 '딥드림'은 입력되는 이미지 요소를 잘게 나눠  데이터화한 후 새로 입력된 이미지에 학습한 이미지 패턴을 적용시키는 GAN 프로그램입니다.

 

 

이 프로그램으로 화가의 화풍을 학습시킨 좋은 예를 살펴볼 수 있는데요. 고흐의 화풍을 학습하여 기존에 존재하던 이미지를 고흐가 그린 것처럼 적용시키거나 고흐가 그린 듯한 새로운 이미지를 만들어 낼 수 있습니다. 또한 생성 AI 기술과 3D 프린팅의 접목으로 유화 특유의 질감까지도 구현이 가능하게 되면서 AI가 그린 그림들로 전시회가 열릴 수도 있는 시대에 도래했습니다.

 

그림의 화풍 변경뿐만 아니라 사진을 특정 화풍의 이미지로 변환 시키는 것도 가능한데요. 'Toonify Yourself!'에서는 얼굴 사진을 인식하여 디즈니 영화의 스타일을 적용하여 디즈니 주인공처럼 만들어주기도 하고, 심지어 사람뿐만 아니라 동물들의 얼굴도 인식하여 적용이 가능합니다. 


▷투니파잉 시작해보기 : https://toonify.photos/

 

Toonify!

AI powered face transformation, see what you'd look like in your own CGI movie.

toonify.photos

GAN 악용, 양날의 검이 되다

 

다양한 분야에서 활용되는 생성 AI, GAN, 뛰어난 기술인 만큼 어두운 이면도 존재하는데요. 이런 생성 AI를 제어할 방법이 없기 때문에  GAN 악용의 위험과 윤리적인 문제가 대두되고 있습니다. 이미 오래 전부터 딥페이크를 악용한 음란물의 문제들은 지속적으로 문제가 되었습니다. 그뿐만 아니라 예술 업계의 존엄성도 위협받고 있는데요. 실존 작가들의 고유의 화풍을 무단으로 복제하여 도용하거나, AI 학습에 무단으로 개인의 작품을 사용하는 등으로 인해 예술인들의 GAN로 인한 피해가 점점 늘어나고 있다고 합니다. 심지어 AI로 생성된 그림이 각 예술 대회에서 수상을 하는 등의 사례가 발생하며 작품의 진위 여부를 판별하는 능력이 점점 더 중요해지고 있습니다. 

 

출처 : 엘리엇 히긴스 트위터

 

최근에는 사회적인 여론 조성이 큰 문제로 떠오르고 있는데요. GAN 기술이 상용화되고, 다양한 서비스들이 출시되면서 일명 '가짜 사진'이 많이 생성되고 있습니다. 그 중에서도 트럼프 전 미국 대통령이 체포되는 이미지가 SNS 상에서 큰 화제를 모았는데요. 트럼프 전 미국 대통령의 기소 가능성이 제기된 시점에 가짜 이미지가 확산되어 더 큰 화제를 모았습니다. 그 사진들을 보면 매우 정교하여 진위 여부를 판별하기 어려울 정도였는데요. 이처럼 가짜 이미지, 영상으로 인해 가짜 뉴스를 생성하고 사회 불안을 조장하거나 여론을 조작할 수 있다는 위험성이 제기되고 있습니다. 



우리에게 좋은 기술인 만큼 이 기술을 활용하기 위해서는 제도적인 부분이 빠르게 적용되어야 하는데요. 악용의 소지를 줄일 수 있도록 제도적인 틀을 빠르게 도입하여 강력한 처벌로 경각심을 심어주어야 하며 이미지와 영상의 진위 여부를 판별하는 기술도 더욱 발전한다면 GAN의 악용을 줄일 수 있을 것입니다. 



무엇보다 개인의 정보를 받아들일 때 스스로 판단하는 판별 능력(미디어 리터러시) 또한 앞으로 더욱 중요해질 것입니다. 생성 AI를 활용한 결과물들이 4차 산업 시대의 꽃을 피우기를 기대하여 오늘은 여기서 마치도록 하겠습니다.



감사합니다.