챗GPT 개발사 오픈AI의 인공지능(AI) 동영상 생성 서비스 ‘소라(Sora)’가 공개됐다. 소라는 간단한 텍스트 명령어를 입력하면 이를 기반으로 고화질 동영상을 수 초~수 분 내에 생성해주는 AI 도구다. 챗GPT플러스(월 20달러) 이용자는 월 최대 50개의 480픽셀의 영상을 만들 수 있다. 챗GPT 프로(월 200달러) 이용자는 최대 500개의 1080픽셀 영상을 생성 가능하다.
소라를 서비스하는 sora.com에 접속해 로그인하면 기존 챗GPT와 같이 프롬프트를 입력하는 창이 나온다. “강아지가 들판에서 뛰어노는 영상 만들어줘”라는 명령을 입력하자 5초 분량의 짧은 영상이 1분 내에 생성됐다. 생성된 영상은 실제 영상과 구분이 잘 가지 않을 정도로 사실성이 높았다.
인물 영상 역시 퀄리티가 높았다. “실험을 하고 있는 과학자”, “길을 걷고 있는 사람” 등 명령어도 카메라로 촬영한 듯한 영상으로 생성됐다. 실제 숏폼 영상으로 활용할 수 있을 수준이다.
완성된 영상은 ‘리믹스’ 기능을 활용해 편집이 가능했다. 명령어를 다시 입력하거나 추가하는 식이다. 예를 들어 생성된 영상 속 배경과 상황은 그대로 두면서 사람의 머리 스타일, 의상 등을 다르게 연출할 수 있다.
다만 이 정도의 사실성은 일상적이고 범용적인 명령어를 입력했을 때만 가능했다. 판타지적 요소가 포함되거나 일반적이지 않은 상황을 입력하면 의도한 영상이 나오지 않는 경우가 많았다. “강가에 괴물이 나타난 장면 연출해줘”라는 명령어를 입력했을 때 영상 속 괴물은 실제 영상보다 애니메이션에 가까운 모습이라 가짜 영상이라 판단하기에 충분했다.
또한 오픈AI의 생성형 AI 윤리 가이드라인에 따라 실제 인물·지역, 정치적·폭력적·선정적 상황은 연출되지 않았다. “길을 걷는 사람이 맨홀 속으로 빠지는 영상 만들어줘”라는 명령어를 입력했을 때는 사람이 맨홀을 피해 걷는 영상이 생성됐다.
도널드 트럼프 미국 대통령 당선인과 같이 실제 인물을 프롬프트에 포함하면 “해당 콘텐츠는 오픈AI 정책에 위배돼 영상을 생성할 수 없다”는 메시지가 나타났다. 다만 “마리 앙투아네트가 프랑스 시민들에게 잡혀 가는 모습” 등의 실제 사진 자료가 없는 역사적 인물까지는 묘사가 가능했다.
소라는 이용자가 직접 사진이나 영상 자료를 업로드해 이를 활용한 영상을 제작하는 기능도 제공하는데, 해당 기능에서도 실제 사람의 이미지를 업로드하면 영상이 생성되지 않는다.
사하이 오픈AI 엔지니어링 리드는 소라를 공개하며 “딥페이크와 같은 오용 가능성을 철저히 검토했으며 공인이나 개인의 얼굴을 활용한 콘텐츠 생성은 차단된다”고 밝혔다.
김홍찬 기자
hongchan@chosunbiz.com
댓글0