생성형 AI 관련 기업 다수가 개발 과정에서 데이터 확보와 비용 부담 등 문제를 겪고 있다고 토로했다.
“비용 부담에 데이터 확보 어려워”
28일 과학기술정보통신부는 한국지능정보사회진흥원과 함께 ‘데이터 중심 AI 가속화 밋업 시리즈’ 행사를 개최했다. 이날 행사는 글로벌 빅테크를 중심으로 치열하게 경쟁이 펼쳐지는 생성형 인공지능(AI) 시대에 국내 기업의 경쟁력 확보 방안을 모색하기 위해 마련됐다.
이날 행사에 참석한 스타트업들은 생성형AI 서비스 구현 과정에서 겪는 여러 어려움에 대해 다양한 의견들을 공유했다.
구름 빅밸류 대표는 “가장 큰 진입장벽은 비용문제다”라며 “프롬프트 설계를 통해 내부 데이터가 어느정도 LLM(거대언어모델) 서버에 탑재돼야 그 다음 좋은 결과 양식의 답변을 만들어낸다. 그런데 지금 LLM이 실제로 어떤 서비스가 반드시 도입됐을때 좋은 결과를 만든다는 유즈케이스(사례)가 아직 넓게 분포되지 않은 상황이다”라고 말했다. 그는 이어 “이런 상황에서 사업 담당자가 섣부르게 (비용을 들여) 서버를 도입하고, 내부 데이터를 연동하는 등을 하기엔 부담이 크다”고 덧붙였다.
김세엽 셀렉트스타 대표는 “한글로 LLM을 만드는 과정에서의 고충은 학습할 수 있는 데이터가 없다는 것이다”라며 “금융권의 경우 서비스를 잘 제공하려면 금융권(공용) 내부 데이터가 필요한데 이게 없다보니 어려움을 겪는다”고 말했다.
이현동 슈퍼브에이아이 부대표는 “AI는 통신과 비슷한 속성을 가진다”며 “고품질의 퀄리티를 계속 유지해야하고 다양한 환경에서 작동해야하는 등 측면에서 어려움이 있다”고 말했다. 그는 이어 “이용자와의 피드백(재학습)을 통해 기술 사이클이 빠르게 효율적으로 구현하는 서비스가 구축될 수 있도록 나름의 노력을 해오고 있다”라고 말했다.
생성형AI 기술 구현 과정에서 데이터 활용을 위한 저작권 등 문제와 관련한 명확한 가이드라인이 없다는 점도 문제로 지적된다.
황현지 스모어톡 대표는 “우리나라에 특화된 스타일의 이미지 생성 서비스를 하고 있는데, 저작권 문제가 많이 걸려있어서, 데이터 활용 한계가 많다”며 “오픈된 저작권 문제 없는 데이터는 겨우 최근에 하나 나왔다. 유럽의 경우 AI로 만든 이미지면 무조건 표시를 하고 있는데, 우리는 그런 공통된 룰이 부재해 써야할지를 두고 고민이 많다. 명확히 AI가 만든건 밝히도록 의무화하는 등 내용의 가이드라인부터 만들어줬으면 싶다”라고 말했다.
“멀티모달 학습도 부족…정부 지원 필수”
김동환 포티투마루 대표도 시간과 비용 등 문제로 국내 기업들이 경쟁력있는 AI 구축에 어려움을 겪고 있다고 토로했다.
김 대표는 “구글, 오픈AI 등 빅테크들은 텍스트 뿐 아니라 음성, 이미지, 동영상까지 결합한 멀티모달 기술로 발전하고 있는데 내후년까지 이 기술 경쟁이 치열해질 것으로 예상된다”라며 “반면 국내에서는 시간과 비용 등 문제로 멀티모달 자체에 대한 학습이 많이 이뤄지지 못한 실정이다”라고 말했다.
그는 이어 “이번 자리를 계기로 이런 분야에 대해 학습 데이터를 구축하고, 기술 고도화를 위한 투자가 많이 이뤄졌으면 싶다”라며 “자체적인 AI를 보유하는 것은 기업을 넘어 국가 경쟁력을 좌우하는 변수가 될 수 있다. 정부차원에서 적절히 데이터를 잘 구축하고 활용할 수 있는 매개역할을 해주길 바란다”고 말했다.
김 대표는 또 “일본에서 학습시킨 인공지능(AI)를 우리가 쓰게 되면 독도는 일본땅이라고 말하게 될 수도 있다”라며 “자체적인 AI 확보 여부가 핵무기를 보유한 것과 마찬가지의 영향력을 가지고 있다”고 말했다. 이어 “국내 자체적인 AI 플랫폼 경쟁력을 확보하는 것이 기업의 경쟁력을 넘어 우리 국가 경쟁력까지 좌우할 수 있다”고 강조했다.
김경만 과기정통부 인공지능기반정책관은 “AI 분야에서 경쟁 우위를 차지하기 위해서는 AI 기술의 발전만큼이나 필요한 데이터가 잘 준비돼 있는 것이 중요하다”며 “이번 행사를 통해 우리나라의 AI 경쟁력 강화를 위해 필요한 데이터를 시의 적절하게 파악하고 잘 준비될 수 있도록 적극 지원하겠다”고 말했다.
이선율 기자 melody@chosunbiz.com
댓글0