자세히 보기

Jon Gold
Senior Writer

베일 속 원고 그룹, 오픈A에 소송 제기 “개인정보 도용, 저작권 침해”

뉴스
2023.06.302분

오픈AI에 대한 새로운 소송은 이 회사가 공공 인터넷에서 스크랩한 훈련 데이터를 계속 사용할 수 있는지 여부를 결정할 수 있다.

오픈AI를 상대로 제기된 소송이 불러올 여파에 눈길이 쏠리고 있다. 이 회사가 인터넷 상에서 수집한 훈련 데이터를 계속 사용할 수 있을지 여부를 결정할 수 있어서다.

챗GPT 생성형 AI를 개발한 오픈AI가 미 연방 집단 소송의 당사자가 됐다. 원고 측은 이 회사가 개인 정보를 훈련용으로 오용했다고 주장하고 있다.

캘리포니아 북부 지방 법원에 접수된 이번 고소장에는 컴퓨터 사기 및 남용법, 전자 통신 개인정보 보호법, 여러 주 소비자 권리법 및 관습법 위반을 포함한 15가지 소송 원인이 나열돼 있다. 고소의 핵심은 오픈AI가 원고측의 개인 정보를 본질적으로 ‘도용’하여 보상 없이 가치 있는 제품을 만드는 데 사용했다는 것이다.

소장에는 “오픈AI가 훔친 데이터를 사용해 대규모 언어 모델과 심층 언어 알고리즘을 활용해 광범위한 애플리케이션에 사용할 수 있는 인간과 유사한 언어를 분석하고 생성하는 [챗GPT]를 훈련 및 개발했다”라고 기술돼 있다.

특히 개인 식별 정보가 포함된 데이터를 공개 인터넷에서 가져옴으로써 오픈AI가 개인 정보를 침해했다고 원고들은 주장했다. 참고로 원고들의 신원은 소장에서 완전히 공개되지 않았다. 원고들은 “침해적 조사”(intrusive scrutiny)를 피하기 위해 법원에 비공개 유지를 요청했다.

원고들은 금전적 손해배상에 더해 여러 요구안을 제시했다. 오픈AI가 거버넌스를 위한 독립적인 AI 위원회를 설립하고 수집한 모든 개인 정보의 전말을 밝혀야 한다는 주장이다. 법원 측에는 오픈AI의 위법 행위에 대해 여러 가지 시정 조치를 취할 것을 요청했다.

한편 이 소송은 AI 학습을 위해 퍼블릭 인터넷의 데이터를 사용하는 것이 미국 저작권법상 공정 사용에 해당되는지에 대한 판결로 이어질 가능성이 높다. 공정 사용에 해당된다면 오픈AI와 같은 AI 제작자가 저작권 위반에 대한 책임을 지지 않아도 된다. 이번 소장은 공정 사용에 대한 논의를 자세히 다루고 있지는 않지만, 매사추세츠에 거주하는 두 명의 저자가 제기한 두 번째 집단 소송은 AI 학습에 사용된 저자의 자료와 관련하여 오픈AI의 저작권 위반을 보다 직접적으로 주장하고 있다.

캘리포니아 북부지방법원에 제출된 해당 소장에서 원고측은 “오픈AI 언어 모델은 고소인(그리고 다른 이들)의 작업물로부터 추출된 정보 없이는 동작할 수 없다. 그리고 내부에 작업물을 담고 있다. 따라서 오픈AI의 언어모델은 그 자체로 침해적 파생물이다”라고 주장했다. 

오픈AI는 논평 요청에 즉시 응답하지 않았다. dl-ciokorea@foundryco.com