[IT 알아보기]/IT 기본학습

[IT 기본학습] 챗GPT 생성형AI 제대로 이해해보자! AI산업을 관통하는 필수 키워드 모음. ZIP

이호스트ICT 2024. 1. 11. 17:33



[IT 기본학습] 챗GPT 생성형AI 제대로 이해해보자! AI산업을 관통하는 필수 키워드 모음. ZIP

안녕하세요, 이호스트ICT입니다. 지난 2023년에 이어 올해 2024년에도 역시 생성형 AI가 전 산업 생태계에 핵심 키워드가 될 전망인데요. 

▼2024년 역시 AI 산업이 지배한다? 10대 기술트렌드 알아보기. 
https://blog.naver.com/ehostidc2004/223316184660





빠르게 변화하고 있는 기술 트렌드 중에서도 특히 챗GPT를 중심으로 하는 생성형AI 기술의 인기가 치솟고 있습니다. 트렌드의 중심에 있는 이 기술이 이제는 진보를 이루는 것을 넘어 우리 일상으로 깊숙이 침투하게 될 것으로 예상되는데요. 오늘 포스팅에서는 생성형AI를 이해하기에 필수적인 키워드들을 모아 알아보도록 하겠습니다. 

①대형언어모델(LLM, Large Language Model) 
대형언어모델 LLM은 생성형AI를 설명할 때 가장 먼저 알아야 하는 개념입니다. 해석하기와 그대로 광범위한 양의 텍스트와 데이터를 학습한 모델을 의미하는데요. 





인간이 어릴 때는 언어에 대한 이해도나 학습량이 적어 단어로 대화를 하거나 짧고 간결한 문장위주의 대화를 한다면 이후 심도있는 학습과 일상 대화를 지속하게 되면서 자연스레 언어능력이 향상됩니다. 이 과정에서 대화의 수준도 높아지고 이해력, 추론능력 등도 올라가게 되는데요. 대형언어모델 LLM 역시 인간의 언어 학습 체계와 비슷한 체계를 지니고 있습니다. 즉, 인간의 메시지와 대화방식을 지속적으로 학습하고 데이터화 하면서 더욱 더 정교하고 자연스러운 대화능력을 갖추게 된다는 것이지요. 
대형언어모델 LLM에 대해 더 심층적인 정보가 필요하신 분께서는 아래 링크를 접속해보세요! 

▼대형언어모델에 대해 알아보기. 
https://blog.naver.com/ehostidc2004/223244385670

②GPT(Generative Pre-trained Transformer) 
대형언어모델이 거대한 양과 언어 데이터를 학습한 '모델'이라고 한다면, 이 대형언어모델의 대표적인 예시가 바로 GPT입니다. ChatGPT는 채팅을 뜻하는 'Chat'과 'GPT'가 결합된 용어로 인간과 대화가 가능할 수 있도록 잘 훈련된 LLM 종류 입니다. GPT는 트랜스포머(Transformer)라고 하는 아키텍처를 기반으로 하고 있으며 인간의 언어처리방식을 모방한 모델입니다. 






인간이 대화를 자주 나누고 일상 속에서 언어학습을 많이 할수록 작문과 대화 실력이 늘어날 수는 있지만 항상 비례할 수는 없습니다. 따라서 단순한 학습을 넘어 보다 효율적으로 전문적인 대화 훈련을 시키기 위해 미국의 인공지능연구소 오픈AI에서 만든 LLM 모델이 바로 GPT인 것입니다. 

③매개변수(Parameter) 
2번째 키워드로 설명한 ChatGPT를 시작으로 생성형AI가 화두가 되자 전세계의 빅테크 기업에서는 이에 뒤처지지 않도록 자체 개발한 LLM을 발표하게 됩니다. 이 때 주목받았던 용어 중 하나가 바로 매개변수(파라미터) 인데요. 

(모델별 매개 변수 개수, 출처 : 요즘IT)



챗GPT와 같은 서비스는 사용자가 원하는 최적의 답을 제공하는 것이 핵심인데요. 질문에 관해서 정밀한 답변을 산출해내기 위해서는 적합한 함수가 필요합니다. 그리고 이 함수는 결과값에 영향을 주는 매개변수들로 이루어져 있죠. 즉, 파라미터는 요리에 비유하면 '레시피의 다양성'으로 설명할 수 있습니다. 다양한 기업에서 파라미터의 수를 강조했던 것도, 매개변수가 많아지면 많아질 수록 보다 정교한 답을 생성할 수 있기 때문이죠. 
하지만 무조건 매개변수가 많다고 해서 정확한 답변이 나오는 것은 아닙니다. 김치찌개를 끓일 때 부재료가 많다고 해서 무조건 맛있는 것이 아닌 것처럼요. 답변의 정확도를 높이기 위해서는 각 변수의 가중치를 적절하게 조정해야 하며 어떠한 변수는 고정된 값을 가지도록 설계되기도 합니다. 
일반적으로 매개변수의 양이 많아질 수록 정확도가 높아지지만 오히려 너무 많아지게 되면 과적합(Overfitting, 모델이 훈련데이터에 지나치게 적응하여 새로운 데이터나 일반적인 상황에 대해서는 오히려 성능이 떨어지는 현상)이 발생하는 경우도 존재합니다. 


④프롬프트 엔지니어링(Prompt Engineering) 


생성형AI가 많은 산업군에 영향력을 끼치게 되면서 LLM 작동방식을 잘 이해하고 원하는 답변을 얻기 위한 '똑똑한 입력' 을 하는 능력이 매우 중요하질 것이라는 예측이 나오고 있습니다. AI 모델이 주어지는 질문이나 명령을 '프롬프트(Prompt)' 라고 부르는데요. 
비슷한 질문이라도 어떤 방식으로 하느냐에 따라 답변 결과가 크게 달라지고 있습니다. 이에 따라 이미 생성형AI가 최적의 답변을 할 수 있도록 질문을 적절하게 입력하는 직업 '프롬프트 엔지니어'가 탄생하고 있기도 한데요. 


⑤토큰(Token) 
토큰 역시 매개변수와 마찬가지로 대형언어모델 LMM의 핵심 구성 요소 중 하나입니다. 토큰(Token)은 언어데이터를 처리하는 기본 단위를 말하는데 일반적으로 단어, 문자, 또는 문장의 일부를 포함합니다. 이 개념에서 '형태소'를 떠올리는 분이 많으실 것 같은데요. 
하지만 토큰은 형태소와 명확하게 개념적으로 차이를 지니고 있습니다. 토큰은 반드시 명확한 의미를 내포하지는 않을 수 있다는 점에 큰 차이점을 지니게 되는데요. 토큰을 구분하는 방식은 모델의 설계와 목적에 따라 달라지기 때문에 그 명확한 기준을 알기는 쉽지 않습니다. 
예를 들어, Unlucky라는 단어가 'Un-'(부정을 의미하는 접두사)와 'lucky'(행운을 의미하는 명사) 두 가지 형태소로 이뤄져있다면 AI 모델에서는 의미에 따라 구분짓는 것이 아닌 'Unlu'와 'cky' 토큰으로 나눌 수도 있다는 것입니다. 
그럼에도 우리가 AI 산업에서 토큰에 대해 관심을 갖는 이유는, 돈과 연결되어 있기 때문입니다. 가격 정책과 직접적으로 연관이 되기 때문입니다. 

(출처 : Openai)



⑥플러그인(Plugins)
플러그인은 기존의 소프트웨어나 시스템에 추가적인 기능을 제공하는 소프트웨어 컴포넌트를 의미합니다. 웹브라우저에 설치하여 특정기능을 확장하는 프로그램들이 플러그인의 훌륭한 예시인데요. 챗GPT가 떠오르면서 재조명받고 있는 개념이기도 합니다. 
챗GPT의 플러그인 개수는 약 940여개에 달하며 지속적으로 증가하고 있습니다. 챗GPT의 다양한 플러그인들은 관광명소를 찾아주는 기능을 하기도 하고, 탐색/검색 기능을 강화하도록 돕기도 하며 데이터 분석이나 코딩 작업도 돕고 있습니다. 

⑦GPU(Graphics Processing Unit)
GPU는 본래 컴퓨터에 이미지를 표시하기 위한 목적으로 주로 사용되었습니다. 게임산업과 영상산업의 발전에 따라 점차 고사양 그래픽, 3D 그래픽 등에 관한 수요가 증가했으며 이러한 수요에 따라 엔비디아는 효과적으로 그래픽연산을 병렬수행할 수 있는 그래픽카드를 개발했습니다. 
AI 열풍이 불면서는 병렬 연산을 통한 신속한 LLM 학습을 위해 GPU가 효과적으로 사용되게 됐는데요. AI 모델 학습에 가장 이상적인 도구로써 급부상 하게 되었지요. 

CPU와 GPU를 함께 비교해보며 GPU의 특징에 대해 더 자세하게 탐구해보고 싶다면 아래 링크에 접속해주세요
https://blog.naver.com/ehostidc2004/223297381761


⑧환각(Hallucinate)
생성형AI는 네이밍에서도 어렴풋 알 수 있듯, 무언가를 '생성'하는 것에 의미를 두는 활동을 합니다. 그러나 이 과정에 있어서 실제 데이터나 사실을 반영하지 않고 비현실적이거나 오류를 포함한 내용을 만들어내는 경우가 있는데요. 이를 바로 환각(할루시네이션)이라고 부릅니다. 
환각의 주요 예시로 3가지를 확인할 수 있는데요. 
▶비현실적인 내용
"콩을 심으면 팥이 자랍니다"와 같이 현실적이지 않은 현상이나 설명을 생성
▶정보의 오류
"젠슨황은 삼성의 창업주다"와 같이 사실/상식의 오류를 생성
▶상황의 오류
부모님 생일선물을 추천해달라고 요청했을 때, "부모님은 대단한 존재입니다"와 같이 질문과 무관한 답변을 생성

이러한 환각(할루시에이션) 현상들은 생성형AI의 치명적인 결함으로 지목받고 있는데요. 이러한 문제들을 완벽히 제거하는 기업이 AI 시장에서 완전한 주도권을 잡게될 것으로 예상되지만 아직까지 그 해결책은 미궁인 상황입니다. 


⑨일반인공지능(Artificial General Intelligence, AGI) 
현재 다양한 분야에서 쓰이는 'AI'라는 워딩은 좁은 의미의 인공지능을 뜻하는데요. 다시 말하면 이세돌과 바둑 대결을 펼친 알파고처럼 특정한 영역에 있어서 성능을 보이는 것을 말합니다. 
하지만 일반인공지능은 특정 분야에 특정되는 것이 아닌 기본적으로 인간과 유사한 지능수준을 갖게된 인공지능을 말합니다. 




AGI는 성인이 된 인간과 유사하게 기본적인 이해능력을 가지고 있을 뿐만 아니라 문제해결, 추록, 창의적사고까지 갖출 수 있는데요. 경험과 학습이 축적됨에 따라 자연스럽게 이 능력들도 향상됩니다. 
챗GPT로 AI 시장에서 주도권을 쥔 오픈AI의 궁극적인 목표 역시 이 일반인공지능 개발이라고 하는데요. 일반인공지능 AGI를 넘어 슈퍼인공지능(Artificial Super Intelligence, ASI)까지 발전할 날이 조만간 우리를 맞이할 듯 합니다. 


⑩멀티 모달(Multi-Modality) 
최초에 세상에 나온 챗GPT는 텍스트 기반의 대화에 국한되어 있었습니다. 질문은 물론 답변도 텍스트로 이뤄졌었는데요. 하지만 현재의 ChatGPT는 이미지나 영상도 생성을 해주며 음성으로도 질문을 할 수 있습니다. 이 때 질문이나 답변에 활용되는 텍스트, 음성, 이미지 등을 모달리티(Modality)라 부르는데요. 다양한 형태의 모달리티를 입/출력에 제한없이 활용하는 방식을 멀티 모달(리티)라고 부릅니다. 
멀티 모달의 개념 역시 위 9번째 키워드에서 서술한 일반인공지능으로 가는 단계의 과도 개념이라고 볼 수 있는데요. 인간이 눈과 귀 등 오감을 통해 습득(인풋)하고 이러한 정보를 기반으로 생각(뇌)하고 말하고(입) 표현(손, 발 등)하는 것처럼 AI역시 다양한 감각기관을 갖추는 과정이라고 이해할 수 있겠습니다. 


⑪인간 피드백 기반 강화학습(Reinforcement Learnign from Human Feedback, RLHF) 
AI 훈련을 강화시키는 주요 방법 중 하나, 바로 '강화학습'인데요. 강화학습은 AI 모델이 특정 환경에서 시행착오를 통해 최적의 행동방식을 학습하는 과정을 말합니다. 이 때 보상(Reward)라는 개념이 필수적으로 기반되게 됩니다. 
비유하자면 게임 속에서 퀘스트를 깨면 긍정적인 보상을 받게 되고 계속해서 다른 과제도 해내려고 하지만 캐릭터가 패배하거나 죽는 등 부정적인 결과가 발생하면 보상을 주지 않아 부정적인 결과가 나오지 않도록 행동을 제어하게 됩니다. 




인간 피드백 기반 강화학습은 이러한 개념의 강화학습에 인간의 피드백이 추가된 접근 방식인데요. AI가 특정 작업을 수행하면 인간 평가자로부터 직접 피드백을 받게 되며 이 피드백에서 받은 정보를 파악하고 상호작용하며 더 나은 행동이 무엇이었을 지에 대해 보다 면밀하게 파악을 하게 됩니다. 인간의 판단과 가치관이 반영되어 일반적인 강화학습보다 더욱 정교하고 인간적인 학습이 가능해지는 것이지요. 





조금 길어진 이번 포스팅에서는 AI 산업 시대를 살아가는 우리가 인공지능을 이해하기 위한 필수 용어들에 대해 살펴보았는데요. IT 계열의 종사자가 아니더라도 현재 뉴스 지면과 매스컴을 지배하고 있는 챗GPT, 생성형AI라는 개념에 대해 좀 더 이해하고자 했던 분들이라면 유익하게 읽어보셨으리라 생각합니다. 앞으로도 변화하는 IT, AI 산업에 관심을 갖고 여러분께 더

쉽게 알려드릴 수 있도록 노력하는 이호스트가 되겠습니다. 감사합니다.