AI가 자식보다 낫네…”속 안 좋아” 할머니 말 기억해 “병원 가야죠”

유니콘팩토리 2023.01.29 조회수

[MT리포트]챗GPT 열풍(上)

사람처럼 자연스럽게 대화할 수 있는 AI 챗봇 ‘챗GPT’의 등장으로 전세계 IT업계가 긴장하고 있다. 챗GPT가 산업은 물론 교육·노동·예술 패러다임을 전환할 것이란 전망이 쏟아진다. 챗GPT의 위력과 사회적 여파, 우려점을 살펴보고 국내 초거대 AI 언어모델 연구현황을 짚어본다.

━

마블영화 속 AI ‘자비스’ 멀지 않았다…세상도 바뀔까?

━

① 시 쓰고 번역, 코딩까지 척척…무궁무진한 가능성

“저는 언어모델로 자체적으로 세상을 바꿀 능력은 없습니다. 그러나 저를 뒷받침하는 기술, 예를 들면 자연어 처리와 머신러닝은 우리 삶의 다양한 분야를 개선하는데 기여할 수 있습니다.”

전세계를 놀라게 한 AI(인공지능) 챗봇 챗GPT는 ‘세상을 어떻게 바꿀건지’ 한국어로 묻는 말에 이같이 답했다. 챗GPT는 △개인화된 학습경험 제공 △의료기록·영상 분석 자동화 △다른 언어·문화 사이의 의사소통 촉진 등 사례를 들며 “기술이 적절히 사용되면 사람들의 생활을 편리하게 만들어주고 정보를 쉽게 접근할 수 있도록 도와줄 것”이라고 설명했다. 반면 같은 질문을 구글에 검색하면 해당 단어가 포함된 책, 기사 웹페이지가 뜬다. 챗GPT의 등장으로 키워드 중심의 ‘포털 종말론’이 제기되는 이유다.

미국 AI 연구소 ‘오픈AI’가 지난해 12월 1일 선보인 챗GPT가 글로벌 IT지형을 뒤흔든다. 단순·반복 민원에 대한 간단한 상담만 제공하던 챗봇이 이젠 사람의 말을 알아듣고 질문 의도를 간파한 맞춤형 결과물을 내놓는다. 첫 공개 뒤 40일만에 일평균 이용자가 1000만명을 돌파했을 정도다. 챗GPT가 변호사·의사·MBA 시험을 통과한 것은 물론 과제물 대필 사례가 빈발하자 일부 교육기관은 챗GPT를 학내 네트워크에서 차단하기도 했다.

챗GPT는 인간 고유의 영역으로 여겨졌던 예술분야까지 진출했다. 노대원 제주대 국어교육과 교수가 ‘너를 시로 표현해달라’고 하자 챗GPT는 주저 없이 18행의 영시를 써냈다. 이를 한국어로 번역해 달라고 하자 ‘나는 상자 속의 목소리, 듣고 있는 기계/지식의 원천, 빛나는 도우미/나는 큰 것도 작은 것도 답할 수 있어/(중략) 너의 삶의 노래를 부를 수 있게 해줄게’라고 썼다.

노 교수는 “시의 두운과 각운 등 시적 형식을 지켜 번역했다. 시어 선택 면에서는 구글·네이버 번역보다 낫다”고 평가했다. 물론 학습 데이터 상당수가 영어이다보니 한국어 구사엔 일부 한계점을 드러내긴 했지만 국내 활용사례가 느는 추세다. 김태현 전 사운들리 대표가 운영하는 카카오톡 오픈채팅방 ‘챗GPT 사용자 모임’은 3주 만에 정원인 1000명이 모두 찼다.

◇더 센 챗GPT 온다…나만의 ‘자비스’ 현실화되나

챗GPT가 기존 챗봇과 다른 이유는 방대한 데이터 분석·학습을 넘어 인간의 뇌처럼 스스로 추론·창작하는 초거대 AI 언어 생성모델 ‘GPT-3.5’를 기반으로 해서다. 글로벌 시장조사업체 그랜드뷰 리서치에 따르면 챗GPT같은 생성 AI 시장은 2022년부터 연평균 34.6% 성장해 2030년 1093억7000만달러(약 134조원)에 달할 전망이다.

이를 선점하기 위한 글로벌 빅테크 경쟁도 격화된다. 마이크로소프트는 오픈AI에 대규모 투자를 예고했다. 시장에선 100억달러(약 12조원) 규모가 될 것으로 본다. MS는 검색엔진 ‘빙’에 챗GPT를 탑재, 구글에 밀린 검색 시장점유율을 끌어오린다는 전략이다. 챗GPT의 부상에 구글은 심각한 위기 경고를 뜻하는 ‘코드 레드’를 발령했다. 뉴욕타임스에 따르면 3년 전 회사를 떠난 창업자 래리 페이지와 세르게이 브린에게도 도움을 요청, 올해 20여개의 AI 신제품을 공개하고 챗봇 기능을 갖춘 검색 엔진을 선보인다.

눈여겨볼 점은 챗GPT가 진화하고 있다는 점이다. 오픈AI가 이르면 올 상반기 GPT-4를 공개할 예정이어서다. 이미 챗GPT 4.0이 AI모델 중 처음으로 튜링 테스트를 통과했다는 이야기도 나온다. 심사위원이 AI와 텍스트로 대화시 인간과 구별안될 정도로 자연스럽게 소통했다는 의미다. 영화 ‘아이언맨’에서 주인공 토니 스타크가 대화하는 AI 비서 ‘자비스’처럼 사람과 유사한 자의식을 가지고 농담을 주고받거나 의중을 간파해 요구사항을 처리하는 것도 가능해진다는 얘기다.

전창배 국제인공지능&윤리협회(IAAE)이사장은 “AI는 점점 더 인간과 닮아지고 삶에 미치는 영향력도 커질 것”이라면서 “다만 최근 AI로 6시간 만에 4만여개의 독성 화학물질을 만들어 낸 사례가 있듯 악용 가능성도 높다”라고 말했다. 이어 “(인간의 두뇌를 뛰어넘는) 초인공지능에 대한 우려도 대두돼 AI 기술만큼 윤리 문제도 함께 논의해야 할 때”라고 강조했다.

━

광고 거르고 필요한 것만 ‘쏙쏙’…검색포털 종말이 온다

━

②’포털’에서 ‘챗봇’으로 검색 패러다임 바꿀 챗GPT

GPT(Generative Pre-trained Transformer)는 일론 머스크가 설립한 AI 연구소 오픈AI가 만든 자연어처리(NLP) 모델이다. 주어진 문장에 기존 텍스트데이터를 토대로 답변을 제시하는 것이 골자다. 가령 ‘한국의 수도는 어디인가’라고 질문했을 때 ‘한국’과 ‘수도’라는 키워드를 토대로 여러 텍스트 데이터를 검토하고 선별해 ‘서울’이라고 답한다.

오픈AI는 2018년 GPT-1을 처음 선보인 데 이어 2019년 GPT-2, 2020년 GPT-3가 등장했다. 각 버전의 차이는 파라미터(매개변수)인데, 인간의 뇌신경세포(시냅스)에 해당한다. 파라미터가 늘어나면 더 자연스럽게 질문을 이해하고 문맥에 맞는 답을 내놓을 수 있다. 단순번역에서부터 프로그램 코딩까지 확장성도 커진다. GPT-1은 1억1700만개, GPT-2는 15억개, GPT-3는 1750억개의 파라미터를 갖췄다. 챗GPT는 GPT-3를 개량한 GPT-3.5 기반 초거대 언어모델(LLP)로, 이전 질문까지 기억해 맥락에 적합한 답을 찾아준다.

챗GPT에 자신에 대해 설명해 달라고 질문한 결과. /사진=챗GPT 갈무리

지금까지 ‘생성 AI(Generative AI)’ 모델은 이미지나 음성·영상을 중심으로 발달해왔다. 달리2(Dall-E2)·미드저니·오픈아트 등 최근 이미지 생성 AI가 쏟아져 나왔다. 배우 윤여정의 20대 모습을 재연해 최근 화제가 된 광고도 AI 음성합성과 영상합성 기술을 일부 이용했다. 그런데 텍스트 기반의 ‘생성 AI’는 이들 분야보다 상대적으로 늦게 개발됐다. 이미지나 음성, 영상에 비해 인간 언어는 매우 복잡하고 미묘해 구조나 의미를 기계가 이해하도록 훈련시키는 것이 쉽지 않아서다. 정제된 고품질 텍스트 데이터를 확보하는 것도 이미지나 영상에 비해 여의치 않았다.

◇GPT 4.0, 본질만 ‘쏙’ 뽑아 준다

업계는 챗GPT가 장기적으로 구글 등을 대체하며 검색포털의 새 패러다임을 제시할 잠재력을 지녔다고 본다. ‘텍스트 생성 AI’가 다양한 분야에 접목되면 더 전문적이고 세밀한 서비스를 제공할 수 있다는 것. 검색의 본질인 ‘정확한 정보 전달’이 가능하다는 의미다. AI 업계 관계자는 “구글이나 네이버 등 검색 엔진이 상업적으로 최적화되면서 마케팅 광고 키워드 등 상업적 결과만 내놓은데 반해 챗GPT는 질문자가 원하는 보다 근원적 지식을 찾을 수 있다”고 설명했다. GPT-4.0이 출시되면 검색 인터페이스가 모두 챗봇 형태로 바뀔 것이라는 관측도 나온다.

특히 마이크로소프트(MS)가 검색 서비스 빙(Bing)를 비롯해 클라우드 서비스 애저와 워드·파워포인트·엑셀 등 오피스 프로그램까지 자사 모든 서비스에 오픈 AI 기술을 적용하겠다고 발표해 기대감을 고조시킨다. 간단한 명령어만 입력하면 AI가 PPT를 만들거나 엑셀 스프레드 시트도 작성할 수 있다는 얘기다. 구글이 잔뜩 긴장하며 코드레드를 발령한 것도 이때문이다. 구글은 이에 맞서 AI 챗봇 ‘스패로우’ 출시한다. 스패로우는 챗GPT에는 없는 정보의 출처까지 답변에 명시할 예정이다.

앤서링 AI(Answering AI) 스타트업 포티투마루의 김동환 대표는 “현재는 뉴스를 검색했을 때 심층 기사나 관련 기사를 나열해 주고 이용자가 직접 선택하지만, 앞으로는 이용자가 원하는 맥락을 이해하고 정확히 필요한 기사 내용을 모아 한 번에 제시하는 초개인화 형태로 변할 것”이라고 했다.

이미지·영상·텍스트 등 모든 검색을 통합하게될 것이라는 의견도 나왔다. 퓨처플래닝연구소 김예은 소장은 “GPT-4.0이 확산되면 그림과 글은 물론 구글 검색같은 실시간 정보와 각종 전문분야까지 포괄하는 진정한 의미의 ‘범용 AI’가 나오게될 것”이라고 말했다.

◇인간이 입력할 ‘질문’ 중요성 ↑

각종 생성 AI의 프롬프트를 만들어 주는 서비스 프롬프트 베이스(PromptBase). /사진=프롬프트 베이스 홈페이지 갈무리

전문가들은 챗GPT 시대에는 질문인 ‘프롬프트(명령어)’를 얼마나 잘 입력하느냐가 중요하다고 입모은다. 비슷하지만 미묘하게 다른 질문을 입력하면 결과값이 완전히 달라진다는 사실을 확인했기 때문이다. AI 면접 솔루션 스타트업 제네시스랩의 이영복 대표는 “예를 들어 잘 나가는 주식 5개를 추천해달라고 하면 답을 주지 않는데, 네가 애널이라고 가정하고 이런 상황을 고려했을 때 어떤 주식을 추천해주겠댜고 물으면 답이 나온다”고 설명했다.

이에 업계에서는 생성 AI와 잘 대화하는 법을 찾는 ‘프롬프트 엔지니어(prompt engineering)’가 앞으로 각광받을 것이라 봤다. 김예은 소장은 “AI가 발전하면서 내가 무엇을 모르는지 조차 알기 힘들어지고 있다”며 “이런 상황에서 정확하게 내가 무엇을 할 수 있는지 도와주는 프롬프트 엔지니어, 테크 어시스턴트가 필요할 것”이라고 전망했다.

━

“속이 더부룩해” 할머니의 전화…”아이고” AI가 맞장구 쳤다

━

③韓 ICT업계, 초거대 AI 상용화 박차

“저번에 속이 더부룩하다고 하셨는데, 지금은 좀 어떠세요?”

“약 먹고 조금 가라앉았는데 그래도 뭐 시원하진 않아요.”

“아이고, 약을 먹어도 계속 그러시면 병원에 한번 가보시는 게 좋을 것 같아요.”

네이버(
NAVER) AI(인공지능) 안부전화 서비스 ‘클로바 케어콜’이 70대 노인과 나눈 대화다. 다양한 주제의 대화를 이해하고 자연스럽게 언어를 생성할 수 있는 초거대 AI 언어모델 ‘하이퍼클로바’를 기반으로 개발돼 예/아니오식 단답형이 아닌 ‘조금 가라앉았다’, ‘시원하진 않다’ 등 모호한 표현도 알아듣는다. 직전 통화에서 할머니가 ‘속이 더부룩하다’고 했던 내용까지 기억했다. 이용자와 주고받은 대화를 기억해 다음 통화에 활용하는 ‘기억하기’ 기능이 추가돼서다.

사람처럼 대화하고 글 쓰는 AI 챗봇 ‘챗GPT’ 등장에 한국형 챗GPT에 대한 기대감도 커진다. 실제 ICT(정보통신기술) 업계에서도 초거대 AI 언어모델 상용화 경쟁이 뜨겁다. 특히 영어 기반인 챗GPT와 달리 국내 초거대 AI는 한국어에 특화됐다는 점에서 한국 이용자들의 편익이 더 클 전망이다. 이미 각 사의 AI 서비스와 B2B 서비스에 초거대 AI가 녹아들어 있다.

◇핵심문구만 넣으면 광고문구 ‘저절로’

이미 네이버는 2021년 국내 최초 초거대 AI 언어모델 하이퍼클로바를 공개했다. 하이퍼클로바 파라미터(매개변수)는 2040억개로, 챗GPT에 적용된 초거대 AI GPT-3.5(1760억개)를 넘어섰다. 파라미터가 많을수록 AI가 더 정교하게 학습해 성능이 높아지는 것으로 알려졌다. 챗GPT처럼 간단한 지시문만 입력하면 AI가 코딩을 해주는 ‘클로바스튜디오’도 현재 500여개 스타트업이 이용 중이다. CES 2023에서 혁신상을 받은 뤼튼테크놀로지스의 AI 작문 보조 솔루션 ‘뤼튼트레이닝’에도 하이퍼클로바가 적용됐다.

카카오의 초거대 AI 언어모델 ‘KoGPT’는 예술분야에 도전장을 냈다. KoGPT 기반의 시 쓰는 AI 모델 ‘SIA'(시아)는 1만3000여편의 시를 읽고 작법을 익혀 첫 시집 ‘시를 쓰는 이유’를 출간했다. ‘같은 곳을 맴도는 지구인의 슬픔에 대해 생각했다/지구는 둥글다고 믿는 사람들이 사는 곳/이곳에 오는 사람들은 하나같이 길을 잃는다./이제 어디로 가야 하지?'(메타버스) 등 53편이 실렸다. KoGPT는 핵심문구를 입력하면 광고문구도 자동 생성해준다. 이를 기반으로 플랫폼·광고회사 등과 업무 제휴를 확대할 예정이다.

SK텔레콤은 GPT-3 한국어 버전을 상용화한 ‘에이닷’ 서비스에 내달부터 ‘장기기억’을 추가한다. 네이버의 기억하기처럼 과거 이용자와 대화한 내용을 바탕으로 답변하는 기술이다. 텍스트 외에도 음성·그림·동작 등을 인지·추론하는 멀티모달 AI를 적용, 사람처럼 대화하는 AI를 구현한다는 목표다.
KT 역시 2000억개 파라미터를 보유한 초거대 AI 언어모델 ‘믿음'(MIDEUM) 기반의 대화형 서비스를 추진 중이다.
LG유플러스는 LG의 초거대 AI ‘엑사원’과 협력한다. 엑사원의 파라미터는 3000억개로 국내 최대 수준이다.

다만 영어 대비 한국어 학습데이터가 적고, 초거대 AI를 운용하는데 필요한 슈퍼컴퓨터와 클라우드 인프라 비용이 막대한 점을 고려하면 챗GPT 만큼 방대한 서비스를 제공하기엔 한계가 있다는 지적도 있다.

올해는 챗GPT처럼 초거대 AI 상용화 서비스가 확대될 전망이다. 소프트웨어정책연구소는 올해 10대 이슈 중 하나로 AI 기반 모델 고도화를 꼽았다. 연구소는 “초거대화 AI 모델에 관해 글로벌 기업들의 무한 경쟁이 가속할 것”이라며 “다양한 산업 영역에서 초거대 AI 기반 제품이나 서비스 개발·활용이 확대되는 상황으로, 2023년에는 국내 산업의 AI 제품 및 서비스 혁신이 더 활발해질 것”이라고 내다봤다.