개인정보보호위원회는 생성형 인공지능(AI) 모델 개발 시 활용되는 ‘인터넷상 공개 데이터’를 안전하게 처리할 수 있는 정부 차원의 기준을 마련했다고 18일 밝혔다. 공개 데이터는 인터넷을 통해 누구나 합법적으로 접근할 수 있는 데이터를 말한다.
공개 데이터는 챗GPT 등 생성형 AI 개발을 위한 학습데이터 핵심 원료다. 실제 AI 개발기업은 커먼크롤, 위키백과, 블로그, 웹사이트 등의 공개 데이터를 수집해 학습데이터로 활용한다.
이런 공개 데이터에 주소, 고유식별번호 등 여러 공개된 개인정보가 포함될 수 있다는 점이 문제다. 현행 개인정보보호법에는 이런 공개된 개인정보 처리에 적용할 명확한 기준도 없다. 개인정보보호위원회가 공개된 개인정보 수집 및 활용 관련 안내서를 마련하게 된 배경이다.
공개된 개인정보 수집·활용 안내서는 우선 개인정보보호법 제15조에 따라 정당한 이익을 달성하기 위해 필요한 경우 공개된 개인정보를 AI 학습과 서비스 개발에 활용할 수 있다고 봤다. 정당한 이익 조항을 적용하려면 AI 개발 목적의 정당성, 공개된 개인정보 처리의 필요성, 구체적 이익형량 등 세 가지 요건을 충족해야 한다.
구체적으로는 공개된 개인정보 처리를 통해 개발하려는 AI의 목적·용도를 구체화해 정당한 이익을 명확화하고 공개된 개인정보 수집·이용의 필요성과 상당성·합리성이 인정돼야 한다. 또 개인정보처리자의 정당한 이익이 정보주체(개인정보 주체) 권리를 명백히 우선해야 한다.
개인정보보호위원회는 AI 기업이 정당한 이익을 근거로 공개된 개인정보를 처리하기 위해 필요한 기술적·관리적 안전성 확보조치와 정보주체 권리보장 방안도 안내서에 담았다. 세부 안전조치는 빠른 기술변화를 고려해 유연하게 도입·시행할 수 있다. 개인정보보호위원회는 실제 안전조치 이행사례도 안내했다.
이 외에도 개인정보보호위원회는 개인정보보호책임자(CPO)를 구심점으로 하는 AI 프라이버시 담당조직을 자율 구성·운영하고 안내서 따른 기준 충족 여부를 평가해 그 근거를 작성·보관하도록 권고했다. 안내서는 향후 개인정보 관련 법령 제·개정, AI 기술발전 추이, 해외 규제정비 동향 등을 고려해 꾸준히 업데이트될 예정이다.
고학수 개인정보보호위원회 위원장은 “인공지능(AI) 기술 진보가 빠르게 이루어지고 있지만 인공지능(AI) 개발의 핵심 관건인 공개 데이터 학습이 보호법에 비추어 적법하고 안전한지 여부는 공백인 상황이었다”면서 “이번 안내서를 통해 국민이 신뢰하는 인공지능(AI)·데이터 처리 관행을 기업 스스로 만들어 나가고 이렇게 축적된 모범사례가 안내서에 지속적으로 반영될 수 있기를 기대한다”고 말했다.
변인호 기자 jubar@chosunbiz.com
댓글0