중국 인공지능(AI) 딥시크(DeepSeek) R1에게 ‘불수능’으로 평가받는 2024년도 수능 국어영역 공통과목을 풀어보라고 주문했습니다. 놀랍게도 34문제 가운데 5문제만 틀려 총 12점이 감점됐습니다. 수학 과목 역시 고난도 문제 몇 개를 빼고는 척척 풀어나갔습니다.
이뿐만 아니라 R1은 미국 수학 경시대회에서 79.8%의 정확도로 미국 오픈AI 챗GPT의 o1(79.2%)을 앞섰다고 합니다. 코딩 테스트에서도 65.9%의 정확도로 o1(63.4%)을 눌렀습니다. IT 매체 테크크런치는 R1이 다양한 수학, 코드 및 추론 작업에서 o1과 비슷하거나 능가한다는 평가를 얻고 있다고 했습니다.
◇ 싸기만 한 줄 알았는데 더 똑똑하네… 美 빅테크도 견제
딥시크가 비용뿐 아니라 기술 측면에서 챗GPT를 앞선다는 평가가 나오며 미국 빅테크 업체들은 ‘움찔’했습니다. 딥시크는 처음 공개됐던 일주일 전 ‘극강의 가성비’로 주목을 받았습니다. 딥시크는 학습 비용 550만달러(79억4475만원)로 o1과 비슷하거나 더 뛰어난 모델을 내놨다고 주장했습니다. 이는 챗GPT 학습 비용 1억달러(1454억3000만원)의 5.4%입니다.
저렴한 R1이 o1보다 낫다면 고객으로서는 굳이 비싼 돈을 들여 챗GPT를 구독할 필요가 없겠죠. 또 막대한 개발 비용이 가장 큰 진입장벽이었던 만큼, AI 후발주자들이 앞다퉈 시장에 뛰어들 가능성도 커졌습니다. 이날 국내 AI 소프트웨어 업종으로 분류되는 네이버와 카카오 주가는 각각 직전 거래일 대비 6.13% 상승한 21만6500원, 7.27% 오른 3만8350원으로 마감했습니다.
딥시크는 공교롭게도 도널드 트럼프 미국 대통령이 ‘AI 패권을 장악하겠다’라는 메시지를 내놓은 직후 공개됐습니다. 이 때문에 양국의 AI 주도권 전쟁이 격화할 것이라는 분석이 나옵니다. 영국 파이낸셜타임스(FT)는 “딥시크, 알리바바, 텐센트, 바이트댄스, 문샷 같은 중국 IT 기업이 미국과의 격차를 좁히며 비용 효율과 역량을 높여왔다”며 “이는 우연이 아니라 미국의 첨단 칩 수출 제한 확대에 따른 불가피한 혁신이었다”라고 분석했습니다.
◇ 딥시크도 ‘환각’ 현상은 극복 못해
그러나 딥시크 열풍이 계속될지는 지켜봐야 할 것 같습니다. 딥시크 R1 역시 AI 모델이 겪는 ‘환각(할루시네이션)’ 증상이 나타납니다. AI 환각 증상이란, 대화형 모델이 맥락에 맞지 않는 엉뚱한 답변을 마치 진실인 것처럼 이야기하는 증상을 의미합니다. 환각 증상은 주로 데이터 품질이 낮거나 정보를 선별하는 알고리즘이 빈약해 발생합니다.
이 때문에 기초적인 질문에도 답변을 하지 못하는 모습을 보입니다. 일례로 31일 오전 서울 성동구 왕십리역에서 서울 중구 광화문역 코리아나호텔로 가는 교통편을 물어보니, 2535분이 걸린다고 대답했습니다. 버스 번호는 알려줬지만, 환승편은 안내하지 않아 목적지에 도착할 수 없습니다. 심지어 택시를 타면 소요 시간은 1520분, 요금은 8억원이 예상된다고 안내합니다.
또 중국 IT 기업으로서는 피할 수 없는 정보 유출 논란도 화두에 올랐습니다. 미국과 유럽 등 전 세계 정부와 기업들은 정보 유출을 우려해 구성원들에게 ‘딥시크를 깔지 말아달라’며 사용을 막고 있습니다.
딥시크의 개발 비용을 어디까지 믿을 수 있을 지도 문제입니다. 딥시크는 기존 업체들이 쓰는 ‘지도 학습(Supervised Fine-Tuning)’ 대신 ‘강화 학습(Reinforcement Learning)’에 집중한 것으로 알려졌습니다. 강화 학습은 AI가 스스로 답을 찾도록 추론 능력을 높이는 기술입니다. 즉, 비용을 들여 특정 분야에 대해 학습을 시켜야 하는 ‘지도학습’ 모델보다 저렴하게 성능을 높일 수 있다는 것입니다.
딥시크는 총 학습 비용은 공개했지만, 개발 과정에 대한 명확한 설명은 피하고 있습니다. 이 때문에 ‘오픈AI’의 학습 데이터를 불법으로 가져왔다는 의혹도 받습니다. 이 의혹이 사실이라면 딥시크의 장점인 ‘가성비’는 퇴색될 것 같습니다. 개발 비용에 학습 데이터 이용 비용도 더해져야 하기 때문입니다.
주재걸 카이스트 AI대학원 교수는 “AI 학습 과정인 ‘디스틸레이션(distillation·증류)’ 단계에서 모범 답안으로 챗GPT를 활용했을 가능성이 있다. AI 업체들이 자주 사용하는 방법”이라고 설명했습니다. ‘증류’란 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 이용하면서 유사한 기능을 개발하는 것을 의미합니다.
주 교수는 또한 “개발 비용이 약 80억원이 들었다는 점은 중국이나 딥시크에서 과장했을 가능성을 배제할 수 없다”라며 “개발 마지막 단계에서 들어간 금액이 80억원이라는 것이지, 시행착오에 투입된 비용까지 포함하면 그보다 더 큰 비용이 들어갔을 것”이라고 진단했습니다.
댓글0