[IT 알아보기]/IT 카드뉴스

AI 음성인식 회의&통화내용 단 1분이면 텍스트 변환! 클로바노트 활용Tip까지 알아보기

이호스트ICT 2023. 2. 1. 17:10



안녕하세요! 이호스트ICT입니다. 

팬데믹의 발생으로 비대면 사회가 지속되며 일반적인 근무 풍경 역시 뒤바뀌고 있습니다. 회의실에 다같이 모여 브리핑을 하는 대신 화상&원격 회의를 하며, 클라이언트와 직접 만나 이야기를 나누는 대신 컨퍼런스 콜을 하곤 합니다. 

음성 통화를 통한 회의, 원격 회의의 내용 등을 회의록으로 작성해야 하는 일은 대게 각 팀의 막내가 하고 있으리라 생각이 되는데요. 이렇게 변화한 업무 환경으로 일지나 회의록 작성에 대한 부담감이 커졌을 지도 모를 것 같습니다. 

인공지능의 발달이 현대인의 삶을 비약적으로 바꾸는 시대! 이러한 에로사항을 단박에 해결해줄 수 있는 IT 기술 “AI 음성인식”이 떠오르는 화두가 되고 있는데요. 오늘 포스팅에서는 AI 음성인식 기술과 네이버 클로바노트, 구글독스 등 실제적으로 활용할 수 있는 방법까지 소개 해드리도록 하겠습니다. 





AI 음성인식 기술을 활용하면 약 1시간 분량의 음성을 단 1분만에 텍스트로 기록을 끝낼 수 있는데요. 코로나로 늘어난 영상회의나 컨퍼런스콜, 전화업무 등의 기반 업무를 보다 효율적으로 할 수 있는 하나의 팁이 되지 않을까 싶습니다. 막내 몫으로 여겨지던 회의록의 작성을 이제는 똑똑한 AI가 도맡아 해주고 있는 것입니다. 








본격적인 포스팅에 앞서, 음성인식 기술의 개요에 대해 알아보겠습니다. 


음성인식(Speech Recognition) 이란 단어 그대로, 사람이 말하는 음성 언어를 컴퓨터가 해석하여 그 내용을 문자 데이터로 전환하는 처리를 말하는데요. 이 때 음성을 문자로 전환하는 STT(Speech-to-Text)와 텍스트를 다시 음성으로 변환해주는 TTP(Text-to-Speech) 크게 두 가지 매커니즘으로 나뉘게 됩니다. 음성인식은 결국 키보드 대신 음성으로 문자를 입력할 수 있도록 해줄 것인데요. 우리는 언젠가 키보드나 마우스와 같은 입력 장치를 사용하지 않아도 기계와 더욱 효율적으로 소통을 할 수 있을 것입니다.


이 기술이 상용화되고 더욱 고도화된다면 AI 컴퓨터와 인간이 대화하는 기술로까지 발달할 수 있는데요. 음성대화 인터페이스 기반 서비스 구성을 토대로 떠올려 볼 때, 현재 인간이 하고 있는 상담서비스나 간단한 질의 등이 챗봇이나 자동음성장치 등으로 대체될 수 있으리라 생각이 듭니다. 






AI 음성인식 기술을 활용할 수 있는 방법 첫번째는, 국내 최대 IT기업인 네이버의 클로바 노트입니다. 클로바노트는 메모와 북마크 기능이 탑재 되어 있어 더욱 간편한 사용이 가능한데요. 참석자의 목소리 구분도 가능하고, 해당 문서를 직접 교환할 필요 없이 링크로 공유할 수 있는 기능까지 더했습니다. 이 클로바 노트를 활용하기 위해서는 안드로이드나 앱스토어에서 앱을 다운로드 후, 네이버 아이디로 로그인하여 음성을 실시간으로 녹음하거나, 녹음되어 있는 음성 파일을 업로드 하면 된다고 합니다. 

클로바 노트 다운로드 




AI 음성인식의 활용 두 번째는 구글독스의 ‘음성입력’ 기능인데요. 다운로드가 필요 없이 크롬 브라우저에 접속하여 음성을 입력하면 텍스트로 변환시켜 주는 기능을 제공합니다. 이 때 녹음 기능을 이용할거라면 마이크가 필요하다는 사실을 숙지해야 할 것인데요. 다양한 언어 스크립트 작성에도 아주 편리한 활용이 가능하고 생각보다 정확도가 뛰어나 특히 유튜버들에게 각광받고 있는 기능이라고 합니다. 

구글독스 (Googledocs) 바로가기 






AI가 업무 환경에도 스며들며 보다 편리하고 효율적인 업무를 돕고 있는데요. AI 생태계는 추후 어떻게 변동될까요? 음성기반 플랫폼을 탑재한 인공지능 생태계는 현재 진행형으로 더욱 고도화, 전문화를 이루며 구축되고 있습니다. loT와 음성 AI 기술을 기반으로 스마트홈, 자동차 등 현대인의 삶 전반적으로 접근하게 될 것입니다. 


인간의 가장 기본적이고, 편리한 의사소통 체계는 바로 언어입니다. 사람과 기계가 소통하기 위한 AI 음성인식 기술이 더 발달하여 자연어, 사투리 등에 관여해서도 정확도가 향상된다면 음성을 통해 명령을 내리고 피드백을 받을 수 있는 기술이 보편화될 것입니다. 음성인식 기술의 발전이 인류에 새로운 산업의 장을 펼쳐줄 것을 기대합니다.