Deep Learning과 저작권 침해

728x90

공개된 자료를 활용한 "딥러닝(Deep Learning)"과 저작권 침해 여부는 현재 전 세계 지식재산권법 분야에서 가장 뜨거운 쟁점 중 하나입니다. "변형적 이용에 따른 공정 이용"으로 인정받으려는 흐름과, "창작자의 경제적 이익 침해"라는 반발이 팽팽하게 맞서고 있습니다. 일본과 유럽처럼 정보 분석을 위한 별도의 면책 조항이 명문화되지 않은 국가에서는 사법부의 공정 이용 판단에 의존해야 하는 상황입니다.

1. 딥러닝 학습 데이터 수집과 저작권 침해

생성형 AI(ChatGPT, Stable Diffusion 등)는 인터넷상의 방대한 공개 자료(기사, 에세이, 사진, 코드 등)를 학습하여 패턴을 익힙니다(Jennifer Jenkins, IP Casebook 6th Ed) . 이 과정에서 다음과 같은 법적 쟁점이 발생합니다.

저작권 자동 발생 원칙: 저작권은 등록 여부와 상관없이 창작물이 고정되는 순간 자동으로 발생하므로, 인터넷에 공개된 대부분의 자료는 저작권법의 보호를 받습니다.
공정 이용(Fair Use) 주장: 많은 AI 개발자들은 수백만 개의 문서를 학습하는 행위가 미국 저작권법상 "공정 이용"에 해당한다고 주장합니다. 이들은 AI 학습이 원본의 예술적 가치를 향유하는 것이 아니라 데이터상의 "패턴(패턴 인식)"을 분석하는 것이므로, 구글 도서 검색(Google Books) 사례처럼 "변형적 이용(Transformative Use)"으로서 정당화될 수 있다고 봅니다.
비표현적 이용(Non-expressive Use): 인공지능이 저작물의 문학적·예술적 "표현" 자체를 소비하는 것이 아니라, 통계적 규칙이나 경향성 같은 비표현적 데이터만을 추출하는 것이라면 저작권 침해로 보기 어렵다는 시각이 있습니다.

2. 시장 저해와 권리 침해 논란

시장 대체 가능성: 과거 구글 도서 검색은 책을 찾는 색인 기능에 그쳐 원본 시장을 대체하지 않았으나, 현재의 AI는 학습한 데이터를 바탕으로 인간 예술가와 직접 경쟁하는 산출물을 만들어내므로 "시장 저해(Market Harm)"가 발생할 수 있다는 우려가 큽니다.
무임승차 논란: "뿌린 대로 거둔다"는 노동 이론(Locke)의 관점에서, 타인의 노력과 투자의 결과물인 저작물에 비용 지불 없이 편승하여 상업적 이익을 얻는 행위는 부당하다는 비판이 있습니다.

3. 국제적 입법 동향 (일본, 유럽, 한국)

4. 기술적 회피와 한계

복제 후 삭제: 일부 AI 서비스(예: Replicant)는 이미지를 다운로드하여 스캔한 후, 식별 정보(해시값)만 남기고 원본 이미지는 즉시 삭제하는 방식을 취하여 물리적 복제본 소지에 따른 책임을 피하려 노력하기도 합니다.
로봇 배제 표준: 웹사이트 소유자가 robots.txt 등을 통해 크롤링을 거부했음에도 불구하고 데이터를 수집했다면, 이는 '접근 권한 없는 자에 의한 데이터 부정 취득'으로 보아 부정경쟁방지법 위반 소지가 생길 수 있습니다.

728x90

유무곤 변호사ㆍ감정평가사