인공지능(AI) 열풍을 일으킨 ‘챗GPT’와 같은 챗봇은 인간 수준의 글쓰기 실력을 보여준다. 이들 챗봇은 인간의 질문에 답을 하는 것은 물론 책을 요약하고 시도 쓴다. 하지만 수학 문제를 풀 때는 이야기가 달라진다. 챗봇은 정확하게 답해야 하는 수학 문제를 풀 때는 종종 틀린 답을 내놓는다. 언어는 수학보다 더 유연하고 관대하기 때문이라는 분석이 나온다.
크리스티안 해먼드 노스웨스턴대 컴퓨터 과학 교수는 23일(현지 시각) 월스트리트저널(WSJ)에 “AI 챗봇은 수학을 하도록 설계되지 않았기 때문에 수학에 어려움을 겪는다”고 설명했다.
AI가 수학에 약한 것은 컴퓨팅 기술이 과거와 달라졌기 때문이다. 1940년대 초기 컴퓨터가 등장한 이래로 컴퓨팅은 수학으로 여겨졌다. 컴퓨터는 인간과 달리 지치지 않고 빠르고 정확하게 계산하는 기계였다. 이에 오랫동안 숫자를 처리하는 것은 컴퓨터가 인간보다 잘하는 영역으로 여겨졌다. 과거 컴퓨터는 단계별로 규칙을 따르고 구조화된 데이터베이스에서 정보를 검색하도록 프로그래밍됐기 때문이다.
하지만 신경망에 기반을 둔 컴퓨팅 기술은 변화를 불러왔다. 인간의 뇌를 모델링한 AI는 엄격한 규칙으로 프로그래밍이 되지 않는다. 대신 방대한 양의 데이터를 분석하고 학습한다. 또한 흡수한 모든 정보를 기반으로 다음에 나올 단어나 문구를 예측해 언어를 생성한다. 인간이 하는 것과 비슷한 과정이다. 해먼드 교수는 “이 기술은 훌륭한 일을 하지만 모든 것을 하는 것은 아니다”라며 “모두 AI가 내놓은 답이 하나이기를 원하지만, 이는 어리석은 일”이라고 했다.
AI 챗봇은 간단한 산수 및 수학을 풀지 못하기도 한다. AI의 숙련도는 향상되고 있지만, 이런 문제는 단점으로 남는다. 최근 열린 한 심포지엄에서 AI 챗봇을 실험하고 있는 교육 비영리 단체인 칸 아카데미의 최고 학습 책임자인 크리스틴 디세르보는 ‘수학 정확도’라는 주제를 소개했다. 1년 이상 챗GPT는 큰 수의 나누기와 곱셈과 같은 작업을 할 때 계산기 프로그램에서 도움을 요청했다는 것이다.
이와 관련해 오픈AI는 성명에서 수학은 “중요한 진행 중인 연구 분야”라며 “과학자들이 꾸준히 진전을 이룬 분야”라고 말했다. 이어 오픈AI는 새로운 버전의 GPT가 시각적 인식과 수학적 추론이 필요한 수천 개의 문제가 있는 공개 데이터베이스에서 거의 64%의 정확도를 달성했다고 강조했다. 이는 이전 버전(58%)보다 증가한 수치다. 오픈AI는 고등학생을 대상으로 한 수학 SAT 시험에서 챗GPT가 백분위를 기준으로 89번째에 들었다고도 했다. 하지만 WSJ는 “세계에서 가장 똑똑한 컴퓨터 과학자들이 모여 숫자에 대한 천재가 아닌 인문학에 더 가까운 AI를 만들어냈다”고 평가했다.
댓글0