주요 메뉴 바로가기 (상단) 본문 컨텐츠 바로가기 주요 메뉴 바로가기 (하단)

“AI 성능 개선 한계 왔나”… 오픈AI GPT-4.5, 성능·가격 논란

조선비즈 조회수  

샘 올트먼 오픈AI CEO./연합뉴스
샘 올트먼 오픈AI CEO./연합뉴스

오픈AI가 27일(현지시각) 최신 인공지능(AI) 모델 ‘GPT-4.5′를 공개했지만, 성능과 가격을 둘러싼 논란이 확산되고 있다. 벤치마크 결과 일부 항목에서 경쟁사에 밀리거나 큰 차이를 보이지 못하면서, 오픈AI의 경쟁력이 흔들리는 것이 아니냐는 분석이 나온다. 앤트로픽, xAI, 딥시크 등이 오픈AI의 성능을 빠르게 따라잡으며 시장의 판도를 바꾸고 있다는 평가다.

28일 업계에 따르면 오픈AI는 GPT-4.5의 환각률이 이전 모델보다 감소했다고 발표했지만, 벤치마크 테스트 결과 경쟁 모델 대비 정보 제공 능력에서 확실한 우위를 보이지 못했다.

오픈AI는 이날 GPT-4.5가 지금까지 출시된 대화형 AI 모델 중 “가장 크고 강력하다”고 발표했다. 감성지능(EQ)이 강화돼 사람과 더욱 자연스러운 대화가 가능해졌으며, 패턴을 인식하고 연관성을 찾는 능력이 향상됐다고 강조했다. 또한, 환각 현상이 감소했다고 밝혔다.

하지만 실제 벤치마크 결과는 오픈AI의 발표와 차이가 있다. AI 벤치마크 테스트에서 GPT-4.5는 에이전트 코딩 평가(Agentic Coding Evaluation)에서 65%의 점수를 기록하며 67%를 기록한 앤트로픽의 클로드 소넷(Sonnet) 3.7에 밀렸다. 이전 버전인 소넷 3.5(new)와 비교해도 불과 3% 앞서는 것에 그쳤다.

에이전트 코딩 벤치마크
에이전트 코딩 벤치마크

AI의 수학·과학·코딩 역량을 평가하는 GPQA(AIME) 및 LCB 벤치마크에서는 항목별로 성능 차이가 확인됐다. 과학(GPQA)에서는 GPT-4.5가 71.4%로 그록3(75%)와 비슷한 수준을 보였지만, 수학(AIME 24)에서는 그록3(52) 대비 낮은 36.7%를 기록했다. 코딩 벤치마크에서는 그록3(57%), 소넷 3.7(57%)보다 낮은 41%로 격차를 보였다.

AI의 일반화 능력을 평가하는 ARC-AGI 벤치마크에서도 GPT-4.5는 논란의 중심에 섰다. 경쟁 모델들과 비교할 때, 성능 대비 비용이 지나치게 높다는 점도 문제로 지적된다. 벤치마크 결과, GPT-4.5는 앤트로픽의 클로드 소넷 3.7(Thinking 8K), O3 Mini Low, R1 모델 등에 비해 성능은 비슷하거나 떨어지는 반면, API(응용 프로그램 인터페이스) 접근 비용은 10배 이상 비싸다. 성능 향상 대비 구독 가격이 과도하게 높아졌다는 점에서 이용자들 사이에서 논란이 커지고 있는 것이다.

업계에서는 이를 두고 “이제 단순히 모델 크기(파라미터 수)와 컴퓨팅 파워를 늘리는 ‘스케일링 법칙’만으로 AI 성능을 올리는 것이 한계에 다다른 것이 아니냐”는 분석을 내놓는다.

오픈AI는 지난해 일반 LLM(초거대언어모델)에서 성능 우위를 점하며 AI 시장을 선도해 왔다. 하지만 최근 AI 업계에서는 추론 모델과 ‘에이전트 AI’가 차세대 기술로 떠오르고 있다. 에이전트 AI는 사용자의 목표에 따라 자율적으로 작업을 수행하는 AI이며, 추론 모델은 복잡한 논리적 사고와 문제 해결에 최적화된 AI다.

강재우 고려대 컴퓨터학과 교수는 “GPT-4에서 추론 모델인 o1이 파생된 것처럼, GPT-4.5 역시 이를 기반으로 한 새로운 추론 모델이 나올 가능성이 있다”며 “오픈AI가 GPT-5부터 일반 모델과 추론 모델을 통합할 계획을 밝힌 만큼, 앞으로는 AI가 특정 작업에서 추론 능력을 발휘하고, 일반 작업에서는 효율적으로 동작하는 방식으로 발전할 것”이라고 말했다.

그는 이어 “기술이 고도화될수록 일반 모델과 추론 모델을 구분할 필요가 없어지고, 경쟁사들도 동일한 방향으로 나아갈 가능성이 높다”고 했다.

조선비즈
content@newsbell.co.kr

댓글0

300

댓글0

[차·테크] 랭킹 뉴스

  • “포르쉐도 안 부럽다”.. 새롭게 ‘깜짝’ 변신한 850마력의 괴물 등장
  • K8 부분변경, 6개월 동안 2만 대 이상 판매…기아 세단 경쟁력 강화
  • 렉스턴 스포츠, 호주에서 2년 연속 최고의 픽업 차지
  • 기아, 삼성전자와 손잡고 PBV 비즈니스 고객 이용 경험 혁신
  • “1800만 원 캠핑카 등장” .. 가성비 높은 모습에 아빠들 마음 ‘들썩’
  • 혼다코리아, 2025 혼다데이 참가자 사전 접수 시작

[차·테크] 공감 뉴스

  • 스텔란티스, 2024년 매출 17% 감소…2025년 수익성 회복 기대
  • BMW 모토라드, ‘2025 봄 서비스 캠페인’ 실시
  • 미국서 15만대 팔았는데 중국선 고작 5000대...현대차·기아 전기차 명암
  • '강력한 성능과 첨단 기술' 2025년형 혼다 오딧세이 공개
  • 넥센타이어, 르꼬끄와 손잡고 퍼포먼스 테니스화 개발
  • [비즈톡톡] 韓서 1년 만에 사용자 300만명 증가… ‘밈’ 등에 업은 스레드

당신을 위한 인기글

  • “조금만 더 기다렸다 살걸 후회..” 기아가 선보인 역대급 가성비 소형 SUV
  • “캠핑카부터 택배차까지 싹 다 바뀐다” 포터·봉고 전부 이 차로 대체!
  • “아빠들 현실 드림카” BMW X5, GV80과 비교불가인 이유
  • “경적도 안 울렸는데 혼자 넘어졌다니까요!” 운전자 과실 80%, 이게 말이 되나요?
  • “결국 원가절감 들어가나” 기본 옵션 빼고 가격 인상한 기아차 근황
  • “싼타페 괜히 샀네” 기존 오너들 깜짝 놀랄 신형 오프로드 SUV
  • “700억 자산에 슈퍼카만 5대” 권상우가 가장 아끼는 7억 럭셔리카는?
  • “같은 값이면 카니발 안타지” 아빠들 환장하는 미니밴의 원조, 혼다 오딧세이 출시
//php echo do_shortcode('[yarpp]'); ?>

함께 보면 좋은 뉴스

  • 1
    강릉 숨겨진 매력 발굴…3000개 돌탑 돌며 소원부터 빌자

    뉴스 

  • 2
    폴란드, T-50으로 자국 영공방위 담금질

    뉴스 

  • 3
    엔비디아 추월한 효율…메타이어 TSMC도 퓨리오사AI '눈독'

    뉴스 

  • 4
    콩나물밥 한그릇 요리 콩나물솥밥 쉬운 솥밥 레시피

    여행맛집 

  • 5
    경주서 신라금관 5점 첫 동시 공개…‘문화 APEC’ 에 총력

    뉴스 

[차·테크] 인기 뉴스

  • “포르쉐도 안 부럽다”.. 새롭게 ‘깜짝’ 변신한 850마력의 괴물 등장
  • K8 부분변경, 6개월 동안 2만 대 이상 판매…기아 세단 경쟁력 강화
  • 렉스턴 스포츠, 호주에서 2년 연속 최고의 픽업 차지
  • 기아, 삼성전자와 손잡고 PBV 비즈니스 고객 이용 경험 혁신
  • “1800만 원 캠핑카 등장” .. 가성비 높은 모습에 아빠들 마음 ‘들썩’
  • 혼다코리아, 2025 혼다데이 참가자 사전 접수 시작

지금 뜨는 뉴스

  • 1
    'MVP의 귀환' 다저스 타선 더 강해진다, 복귀하자마자 안타 신고 "느낌 좋았다" 대만족

    스포츠&nbsp

  • 2
    중동 방한객 잡아라…‘알람 아라비 코리아’ 48개사로 확대

    뉴스&nbsp

  • 3
    '157km K머신 vs 110순위의 기적+ SSG-KT 선발 라인업 발표…화이트 햄스트링 부상으로 귀국 예정 [MD오키나와]

    스포츠&nbsp

  • 4
    한미 산업장관 첫 회동...'관세·조선 실무채널' 운영 합의

    뉴스&nbsp

  • 5
    “겨우겨우 1억 모았는데”… 5060 중장년층, 깊어지는 ‘한숨’

    뉴스&nbsp

[차·테크] 추천 뉴스

  • 스텔란티스, 2024년 매출 17% 감소…2025년 수익성 회복 기대
  • BMW 모토라드, ‘2025 봄 서비스 캠페인’ 실시
  • 미국서 15만대 팔았는데 중국선 고작 5000대...현대차·기아 전기차 명암
  • '강력한 성능과 첨단 기술' 2025년형 혼다 오딧세이 공개
  • 넥센타이어, 르꼬끄와 손잡고 퍼포먼스 테니스화 개발
  • [비즈톡톡] 韓서 1년 만에 사용자 300만명 증가… ‘밈’ 등에 업은 스레드

당신을 위한 인기글

  • “조금만 더 기다렸다 살걸 후회..” 기아가 선보인 역대급 가성비 소형 SUV
  • “캠핑카부터 택배차까지 싹 다 바뀐다” 포터·봉고 전부 이 차로 대체!
  • “아빠들 현실 드림카” BMW X5, GV80과 비교불가인 이유
  • “경적도 안 울렸는데 혼자 넘어졌다니까요!” 운전자 과실 80%, 이게 말이 되나요?
  • “결국 원가절감 들어가나” 기본 옵션 빼고 가격 인상한 기아차 근황
  • “싼타페 괜히 샀네” 기존 오너들 깜짝 놀랄 신형 오프로드 SUV
  • “700억 자산에 슈퍼카만 5대” 권상우가 가장 아끼는 7억 럭셔리카는?
  • “같은 값이면 카니발 안타지” 아빠들 환장하는 미니밴의 원조, 혼다 오딧세이 출시

추천 뉴스

  • 1
    강릉 숨겨진 매력 발굴…3000개 돌탑 돌며 소원부터 빌자

    뉴스 

  • 2
    폴란드, T-50으로 자국 영공방위 담금질

    뉴스 

  • 3
    엔비디아 추월한 효율…메타이어 TSMC도 퓨리오사AI '눈독'

    뉴스 

  • 4
    콩나물밥 한그릇 요리 콩나물솥밥 쉬운 솥밥 레시피

    여행맛집 

  • 5
    경주서 신라금관 5점 첫 동시 공개…‘문화 APEC’ 에 총력

    뉴스 

지금 뜨는 뉴스

  • 1
    'MVP의 귀환' 다저스 타선 더 강해진다, 복귀하자마자 안타 신고 "느낌 좋았다" 대만족

    스포츠 

  • 2
    중동 방한객 잡아라…‘알람 아라비 코리아’ 48개사로 확대

    뉴스 

  • 3
    '157km K머신 vs 110순위의 기적+ SSG-KT 선발 라인업 발표…화이트 햄스트링 부상으로 귀국 예정 [MD오키나와]

    스포츠 

  • 4
    한미 산업장관 첫 회동...'관세·조선 실무채널' 운영 합의

    뉴스 

  • 5
    “겨우겨우 1억 모았는데”… 5060 중장년층, 깊어지는 ‘한숨’

    뉴스