LLM 7

[IT 기본학습] 대형언어모델(LLM)과 대형멀티모달모델(LMM)의 정의, 그리고 GPT-4V

안녕하세요. 이호스트ICT입니다. 챗GPT가 출시되며 현재 전세계는 AI 붐입니다. AI관련 기사를 보면 LLM이라는 용어를 심심찮게 볼 수 있는데요, 오늘은 이 대형언어모델(LLM)이라고 불리는 ‘거대 언어 모델’의 정의와 더 나아가 최근 새롭게 떠오르고 있는 대형멀티모달모델(LMM)의 정의, 이 LMM이 적용된 GPT-4V의 새로운 기능에 대해 알아보겠습니다. 대형언어모델 LM (Large Language Model) 이란? 대형언어모델 LLM을 이해하려면 우선 NLP를 이해해야 합니다. NLP(Natural Language Processing_자연어 처리)는 인간의 언어를 이해하고 처리하는 데 초점을 맞춘 인공지능 분야입니다. 인간의 언어는 모호하고 복잡하기 때문에 이러한 인간의 언어를 정확히 파악..

[IT 소식] LLM은 옛말...이미지까지 학습한 'LMM' 뜬다

'GPT-4V' 이어 '제미니' 공개 임박...오픈 소스 '라바'도 인기 '대형언어모델(LLM)'에 이어 앞으로는 '대형멀티모달모델(LMM)'이라는 용어가 보편화될 것으로 보인다. 기존에는 '멀티모달 LLM'으로 불렀으나, 최근 미국의 일부 기업과 매체가 기존 모델과의 차별화를 위해 LMM이라는 새 용어를 밀고 있다. 이는 오픈AI의 'GPT-4V(비전)'에 이어 올말 출시 예정인 구글의 차세대 모델 '제미니' 역시 LMM이며, 최근에는 오픈 소스 LMM '라바(LLaVA) 1.5'까지 개발자 사이에서 인기를 누리고 있기 때문이다. 이처럼 기존의 '언어' 학습을 뛰어넘어 '이미지' 학습까지 더한 LMM이 화두로 떠오르고 있다. 벤처비트는 11일(현지시간) 오픈 소스 커뮤니티에서 라바 1.5가 GPT-4V..

카테고리 없음 2023.10.13

[IT 소식] 메타, 상업용 오픈소스 LLM ‘라마2’ 공개

MS '애저', AWS, 허깅페이스 통해 서비스... 70~700억 파라미터, 2조개 토큰, 4096개 토큰 컨텍스트 창 활용 메타가 18일(현지시간) 최신 대형언어모델(LLM) ‘라마2′를 상업용으로 사용할 수 있는 무료 오픈소스로 공개했다. 연구 목적으로 공개한 '라마' 사용자들이 상업용으로도 사용할 수 있게 해 달라는 요구를 전격 수용한 행보다. 특히 이번에는 기존 오픈소스 공개 창구였던 허깅페이스 외에 MS '애저'와 AWS 등 클라우드 서비스를 통해 이용할 수 있도록 한 점이 눈에 띈다. 후발주자라는 단점을 극복하고 보다 많은 사용자를 확보하기 위해 공급 통로를 전방위로 확대하려는 의도로 보인다. 이번에 공개한 '라마2'는 70억~700억개의 매개변수 버전을 지원한다. 2조개에 달하는 토큰으로 ..

[IT 소식] 엔비디아, 온디바이스 AI 개발 나선다

엔비디아, 온디바이스 AI 개발 나선다 스타트업 옴니ML의 AI 모델 압축 기술 인수 엔비디아가 생성 인공지능(AI) 기술을 스마트폰과 같은 모바일 기기로 가져오기 위한 경쟁에 뛰어든 정황이 포착됐다. 최근 빅테크 기업이 운영하는 클라우드를 통하지 않고 실행하는 이른바 온디바이스 AI에 몰두하는 기업이 늘어나는 가운데 엔비디아가 AI 모델을 압축해 다양한 엣지 장치에서 실행할 수 있도록 하는 스타트업 옴니ML을 인수해 눈길을 끌고 있다. 디인포메이션은 30일(현지시간) 지난 2월 머신러닝(ML) 모델을 축소하고 최적화해, 클라우드가 아닌 장치에서 실행할 수 있도록 지원하는 소프트웨어 개발 스타트업인 옴니ML을 인수했다고 전했다. 옴니ML의 소프트웨어 플랫폼인 ‘옴니마이저(Omnimizer)’는 정확도를 ..

[IT 소식] 답변이 아니라 '대화하는' 챗봇 출시한 거물 스타트업

답변이 아니라 '대화하는' 챗봇 출시한 거물 스타트업 MS·구글 핵심 멤버..."사람과 상호작용하는 AI" 마이크로소프트(MS)와 구글의 거물들이 설립해 주목받았던 인공지능(AI) 스타트업 인플렉션AI가 첫 제품을 출시했다. '챗GPT'와 같은 AI 챗봇이지만, 다른 모델과 달리 인간과의 상호작용에 초점을 맞췄다. 블룸버그는 2일(현지시간) 인플렉션 AI가 웹과 iOS를 포함한 여러 플랫폼에서 구동하는 챗봇 '파이(Pi)'를 출시했다고 소개했다. 인플렉션 AI는 레이드 호프만 링크드인 공동창업자 겸 오픈AI 이사와 무스타파 술레이만 딥마인드 공동창업자가 지난 3월 각자 사표를 낸 뒤 설립한 회사다. 링크드인은 MS의 자회사이며, 딥마인드는 구글의 자회사로, 회사 설립 전부터 이들의 만남은 화제였다. 이들..

[IT 소식] 엔비디아, 환각현상 방지 도구 '네모 가드레일' 오픈소스로 공개

엔비디아, 환각현상 방지 도구 '네모 가드레일' 오픈소스로 공개 특정 주제 및 유해 콘텐츠 차단 역할...유해한 명령 실행도 막아줘 엔비디아가 생성 인공지능(AI)이 거짓정보를 사실인것처럼 꾸며서 내놓는 환각현상을 방지해주는 솔루션 '네모 가드레일(NeMo Guardrails)'을 오픈소스로 공개했다고 CNBC가 25일(현지시간) 보도했다. ‘네모 가드레일’은 AI 모델이 사실과 다른 오류를 설득력 있게 말하거나 유해한 질문에 답하지 못하도록 한 소프트웨어다. 사용자와 챗GPT와 같은 대규모언어모델(LLM) 사이에 위치해 모델이 특정 주제에 대해 이야기하도록 강제하고, 유해한 콘텐츠는 차단한다. 컴퓨터에서 유해한 명령을 실행하지 못하도록 막기도 한다. 조나단 코언 엔비디아 응용 연구 부문 부사장은 "사용..

[IT 소식] MS, 멀티모달 대규모 언어 모델 ‘코스모스-1’ 공개

MS, 멀티모달 대규모 언어 모델 ‘코스모스-1’ 공개 텍스트를 이해하고 이미지를 인식해 다양한 텍스트를 생성 마이크로소프트(MS)가 시각 및 언어 기능을 갖춘 멀티모달 대형 언어 모델(MLLM) ‘코스모스-1(Kosmos-1)’을 공개했다. 이로서 MS가 그동안 오픈AI에 거액을 투자한 뒤 '챗GPT'를 검색과 오피스 및 윈도 프로그램에 탑재하는 등 적극 활용하는 동시에 내부에서도 인공지능(AI)을 자체 개발하는 투트랙 전략을 구사해 왔다는 사실이 밝혀졌다. 아스테크니카는 2일(현지시간) MS가 공개한 '코스모스-1'은 이미지를 분석하고 그에 대한 질문에 답하고, 이미지에서 텍스트를 읽고, 이미지에 대한 캡션을 작성하고, 지능 테스트를 수행할 수 있는 멀티모달 모델이라고 소개했다. 멀티모달은 여러 가지..