[서울=뉴스핌] 최원진 기자= 생성 인공지능(AI) 챗GPT를 개발한 오픈AI가 자사 AI 기술 훈련을 위해 수많은 이들의 저작권과 프라이버시를 침해했다며 소송을 당했다고 워싱턴포스트(WP)가 28일(현지시간) 보도했다.
미 캘리포니아 소재의 로펌 클락슨은 인터넷상의 수많은 단어가 사람에 의해 쓰인 것임에도 불구하고 오픈AI가 이들의 동의 없이 정보를 수집해 영리를 취하고 있다며 집단 소송을 제기했다.
로펌의 파트너 변호사인 라이언 클락슨은 "모든 정보는 거대언어모델(LLM)에 의해 사용될 의도가 전혀 없었는데도 대규모로 수집되고 있다"며 데이터가 사용됐다면 어떻게 보상해야 하는지 등 기준점을 마련해주길 바란다고 말했다.
이어 "우리는 매우 강력한 이 기술을 만들기 위해 자신의 정보가 도용되고 상업적으로 유용된 실제 사람들을 대표하고 싶다"면서 이미 원고들이 있고 적극적으로 더 많은 원고를 모집하고 있다고 덧붙였다.
소송건은 이날 오전 캘리포니아주 북부 연방지방법원에 송부됐다.
생성 AI 기술은 개방된 인터넷상의 수많은 단어를 수집해 추론 방법을 구축하고 학습함으로써 LLM을 개발하고 개선해 나간다. 챗GPT가 이용자의 명령어에 부합하는 결과물을 내놓을 수 있는 것은 결국 인터넷상의 방대한 정보를 학습해 훈련했기 때문인데, 오픈AI는 정보 제공자의 동의를 구하지 않았을뿐더러 유료 서비스 챗GPT 플러스(+) 등으로 상업적 이익을 챙기고 있단 설명이다.
WP는 이번 소송이 온라인상의 소셜미디어, 뉴스 기사, 위키피디아와 같은 오픈 백과사전 정보들을 기업이 기술 훈련에 사용할 때 인터넷 사용자의 권리 침해에 해당하는지 새로운 법적 이론 테스트가 될 것이라고 진단했다.
미국과 유럽연합(EU) 등 주요국들이 저작권과 프라이버시 침해 우려로 법적 장치를 추진하는 가운데 AI 업계에서는 인터넷상의 정보 사용을 '공정 사용'(fair use)으로 간주해야 한다고 주장한다.
실리콘밸리 법률회사 '건더슨 데트머'의 지식재산권 변호사 캐서린 가드너는 "AI 기술 훈련에 데이터 공정 사용 이슈는 앞으로 수개월, 수년간 법정에서 계속 보게 될 것"이라고 말했다.
챗GPT와 오픈AI 일러스트 이미지. [사진=로이터 뉴스핌] |
wonjc6@newspim.com