AI와 저작권법

Stability AI, ChatGPT 및 Copilot와 같이 이미지, 영상, 코드, 텍스트 등을 학습한 AI 모델을 사용하는 것은 저작권 침해를 포함하여 다양한 위험 요소가 있습니다. 다만, 이러한 도구들은 생산성을 높일 수 있고 기술의 혁신을 주도할 수 있으므로, 그 사용을 막는 것이 아니라 위험성을 미리 파악하고 관리하여 사용해야 할 것입니다.

이 가이드에서는 생성형 AI 도구 사용의 모범 사례, 사용 위험성, 저작권 문제 및 분쟁과 논란에 대해서 알아봅니다.

생성형(Generative) AI 사용의 모범 사례 정책

생성형 AI 사용의 위험요소

생성형 AI 사용의 모범 사례 정책(Policy for Generative AI Best Practices) 문서에서 확인할 수 있듯, AI 사용 시 발생할 수 있는 위험요소의 종류는 아래와 같습니다.

입력 리스크(Input Risk)
AI 모델이 학습하는 데이터는 다양한 라이선스 조건(또는 라이선스 조건 없이)에 따라 제공되어 모델을 학습할 때 어떤 데이터를 선택할지 결정하는 것이 어렵습니다. 이러한 상황은 다수의 AI 개발자가 마주하는 문제이기도 합니다.
또한, 라이선스 조건 외에도 메타데이터 및 웹사이트의 서비스 이용 약관을 파악하여 데이터에 관련한 법적 문제를 예방해야 합니다. AI 모델은 크롤링이나 데이터 분석을 거친 다양한 데이터를 학습에 사용하는데, 어떤 데이터에는 법적 제약이 적용될 수 있습니다. 이러한 제약 조건은 데이터를 가져오는 서비스의 약관이나 데이터의 메타데이터에 상세하게 기록되어 있습니다. 이 정보들을 올바르게 해석하고 충족해, 위험할 수 있는 법적 문제를 방지할 수 있습니다.
출력 리스크(Output Risk)
모델에 의해 생성된 출력은 AI 모델이 학습 데이터와 유사하게 나타날 수 있습니다. 때문에 머신러닝(Machine learning)의 생성물이, 모델이 학습하는 데 사용한 저작물의 저작권을 침해한다는 주장이 꾸준히 제기되었습니다. 이 저작권 침해 위험은 AI 모델 개발자 및 사용자 모두에게 적용됩니다. 사용자는 저작권 침해에 대한 기본 책임이 있으며, 개발자는 간접적인 침해에 대한 책임이 있을 수 있습니다.

따라서, 위 두 위험요소를 적절히 통제한다면 생성형 AI를 사용하는 위험성을 크게 낮출 수 있을 것입니다. 관련 내용은 아래에서 후술 합니다.

생성형 AI 사용 시 권고 준수 사항

생성형 AI 사용 과정에서 발생할 수 있는 위험 요소를 통제하기 위해, 아래의 권고사항들을 준수합니다.

대규모 데이터 세트에 대해 트레이닝을 한, 신뢰할 수 있는 출처의 AI 도구만 사용합니다.
신뢰할 수 있는 대용량의 데이터를 기반으로 학습된 AI를 사용합니다. 책임감 있게 학습된 모델은 저작권을 침해할 가능성이 낮습니다. 또한, 대용량 데이터 세트로 학습하면 일반적인 출력을 생성할 가능성이 높아지므로, 저작권 침해 위험을 낮출 수 있습니다.
AI 도구에만 의존하지 않습니다.
AI가 생성한 결과를 보완할 수 있도록, 사용자의 주관적인 판단과 검토가 필요합니다.
일반적인 출력을 생성하도록 AI 도구를 사용합니다.
일반적인 출력(저작권과 최대한 관련이 없도록 하는 출력)을 생성하도록 AI를 사용합니다. 이 용도로 사용하는 경우에 저작권이나 상표권을 침해할 가능성이 낮습니다. 또한, 생성형 AI에게 저작권 및 상표권을 침해하는 컨텐츠 생성을 지시하지 않도록 합니다. 예를 들어, 이미지 생성 AI에 위험한 상황에 처한 피카츄 그림 같은 프롬프트를 사용하지 않습니다.
AI 생성 결과가 일시적으로만 필요한 경우에 사용합니다.
검색 쿼리 결과 같은 경우, AI의 생성 결과가 비영구적(일시적)으로 사용되므로 위험요소가 상대적으로 적습니다. 생성 결과가 지속되거나, 재사용될 수 있는 경우 위험도가 높습니다.
가능한 경우 AI의 출력을 분리합니다.
AI의 출력 결과를 가능한 다른 원본 데이터와 분리하여 저장하고 관리해, 결과의 정확성을 확인하고, 생성물을 추적할 수 있도록 합니다.
AI 도구가 제공하는 모든 필터링을 활성화합니다.
생성된 결과를 보다 정확하고 의미 있는 형태로 정제하고, 불필요한 결과나 부적절한 결과를 필터링할 수 있도록 합니다.

권고 사항 준수 예시

생성형 AI 사용 권고 준수 사항을 지키며, AI 도구를 사용하는 예시들은 아래와 같습니다.

GitHub의 Copilot

GitHub의 Copilot은 아래와 같이 입력을 필터링할 수 있는 기능을 제공합니다.

Github Copilot
GitHub Copilot에는 GitHub에서 퍼블릭 코드와 일치하는 코드 제안을 검색하는 필터가 포함되어 있습니다. 사용자는 필터를 사용하거나 사용하지 않도록 선택할 수 있습니다.
필터를 사용하도록 설정하면, GitHub Copilot은 제안한 코드의 약 150자 주변 코드들을 활용해, GitHub의 퍼블릭 코드와 생성된 코드 제안을 비교합니다. 결과가 일치하거나 거의 일치하는 경우, 제안이 표시되지 않습니다.
예정된 Copilot의 다음 주요 릴리스에서는 해당 리포지토리에 대한 참조와 일치하는 공개 코드 문자열을 식별하는 기능(Preview: referencing public code in GitHub Copilot)을 제공할 예정입니다. 혹시 발생할 수 있는 저작권 침해 책임을 줄이기 위해, AI 도구에서 이러한 필터링을 사용하도록 선택하는 것을 권장합니다.

이미지 및 음악

AI 도구를 사용해 생성한 이미지 및 음악의 경우, 사용자는 저작권을 침해할 가능성이 있는 출력물을 다른 파일(저작권을 침해하지 않는 AI 도구로 다시 생성하거나, 스톡 이미지 또는 음악)로 교체합니다.

소프트웨어 소스 코드

AI 도구를 사용해 생성한 소스 코드의 경우, 사용자는 Black Duck과 같은 도구를 사용해, 생성된 소스 코드가 침해할 수 있는 저작권을 미리 스캔할 수 있습니다.

참고하기
보다 더 다양한 오픈SW 검사도구들은 오픈소스SW 라이선스 종합정보시스템(OLIS) - 그 외 오픈SW 검사도구에서 확인할 수 있습니다.

생성형 AI 사용의 위험성

생성형 AI를 구축하거나 모델을 사용 시 그 위험성과 문제점을 반드시 인식하고 있어야 합니다. 이 과정에서 프라이버시(사생활) 침해, 퍼블리시티권 침해, 데이터 사용에 대한 규제(예: HIPAA), 명예훼손 및 보안과 같은 문제들을 고려해야 합니다.

또한, AI 모델은 부적절하거나 오류가 있는 결과를 생성할 수 있으며, 이러한 위험을 관리하기 위해 사람이 생성 결과물을 확인하는 절차가 필요할 수 있습니다.

생성형 AI 소송 사례

Midjourney and Stability AI: 학습 이미지에 대한 집단 소송, 작가의 이름을 입력하여 화풍 반영
Stability AI vs. Getty Images: 게티 이미지의 동의 없이 미술 저작물을 학습 데이터로 수집
ChatGPT에 대한 명예훼손 소송 (참고: 명예훼손법은 관할권에 따라 그 법이 상이합니다)

AI 명예훼손 이슈 기사
“내가 성폭행범이라고?”…챗GPT가 씌운 누명, 대책도 없다
법적 분쟁 부른 ChatGPT의 ‘실수’…오픈AI 피소

퍼블리시티권이란?
본인의 이름이나 초상에 대한 독점적인 권리를 말합니다. 즉, 이름 또는 초상에 대한 상업적 이용에 초점을 맞추고 있으며, 재산적 가치가 있는 유명인의 이름 및 초상 등을 상업적으로 이용하고 통제할 수 있는 배타적인 권리를 지칭합니다.

AI 시대의 저작권 문제

최근 AI가 기존 저작물을 학습하여 만들어낸 다양한 파생 저작물이 저작권이 존재하는지에 대한 법률적 논쟁이 대두되고 있습니다.

AI를 활용한 창작이 이제 막 활성화되는 가운데, 아직 국내에서는 법규나 정책마련이 미흡한 상황이며 해외의 경우도 각 나라별로 마련하고 있는 법규나 정책이 상이합니다. 따라서, AI를 사용할 때 저작권에 대한 주의를 기울여야 합니다.

참고하기
본 문단은 Upstage - [AI와 저작권법] 내가 만든 AI 모델은 합법일까, 불법일까?의 내용을 참조하였습니다.
보다 자세한 내용은 해당 링크를 참고합니다.

AI와 저작권법

좋은 학습 데이터로 학습한 경우, 좋은 AI 모델을 만들 수 있게 되며 사용자들의 생산성이 크게 향상될 것입니다. 다만, AI가 학습한 데이터와 생성한 결과가 저작권법에 저촉되지 않는지 고려가 필요합니다.

국내에는 아직 관련 법규가 미흡한 상황이기 때문에, AI와 사용자 모두를 고려한 좋은 방향의 법 개정을 위해 관심을 가질 필요가 있습니다.

AI 학습 데이터 저작권법

좋은 AI를 만들기 위해서는 많은 양질의 데이터를 사용한 학습이 필수적이지만, 아직 AI 학습에 데이터 활용 시의 저작권 침해에 관한 명확한 기준이 없습니다.

뉴스 기사 제목의 저작권
뉴스 기사의 저작권은 언론사에 있습니다. 반면, 뉴스 기사의 제목은 저작물로서의 가치를 인정받지 못하기 때문에 저작권법의 보호를 받지 못합니다.
따라서, 뉴스의 제목만을 사용해 보고 뉴스 기사가 어떤 카테고리에 속하는지 예측하는 모델을 만들고 싶은 경우, 그 데이터를 합법적으로 활용할 수 있습니다.

AI 개발 과정에 개입 가능한 규제법
신용 정보의 보호 및 이용에 관한 법률
개인정보보호법
공정거래법

참고하기
본 문단은 Legal Issues of AI Technologies / Case Study: Getty Images v. Stability AI의 내용을 참조하였습니다. 보다 자세한 내용은 해당 링크를 참고합니다.

AI 생성물 저작권법

분쟁과 논란

AI 이미지 생성

Getty Images는 Stability AI를 상대로 런던의 법원 및 미국 델라웨어주의 연방법원에 각각 소송(23년 1 ~ 2월)을 제기했습니다.

Getty Images는 이미지 생성 AI인 Stable Diffusion의 개발사인 Stability AI가, 1,200만 장 이상의 사진을 복제하고, 이를 사용해 Getty Images의 서비스와 경쟁하고 있다고 주장했습니다.
또한, Sarah Andersen 등 3명의 예술가들은 1월 중순 Stability AI, Midjourney(이미지 생성) 및 DeviantArt(작품을 생성하는 DreamUP의 개발사)를 상대로 샌프란시스코의 연방법원에 집단소송을 제기하였습니다. 이들은 피고들이 웹상에서 예술가의 동의를 받지 않고 500억 개의 이미지로 AI를 교육시킴으로써 수백만 예술가의 저작권을 직간접적으로 침해했다고 주장했습니다.

Copilot

Matthew Butterick 등의 프로그래머들이 GitHub, MS 및 OpenAI를 상대로 집단 소송(22년 11월)을 제기했습니다.

GitHub Copilot은 사용자가 원하는 소스 코드에 관련한 내용을 입력하면 이를 자동생성해 주는 서비스로, GitHub의 데이터를 학습에 활용하였다고 알려져 있습니다.

SPFBO 대회

SPFBO(Self-Published Fantasy Blog-OFF) 책표지 대회의 우승작이 AI 창작물로 밝혀졌습니다.

M.V. Prindl의 판타지 소설 The Wizard는 SPFBO 책 표지 대회 우승작의 책으로 주목받았으나, 해당 작품이 AI 생성 이미지라는 것이 알려져 논란이 되었습니다.
이 사건 이후, SPFBO 대회의 주최자인 작가 Mark Lawrence는 향후 책 표지 대회 개최를 포기한다고 선언하였습니다. 또한, 이를 계기로 다수의 작가들이 자신과 계약한 아티스트가 AI를 사용했는지 의심하는 문제가 생기기도 하였습니다.

문제 발생 이후, CLarkesworld의 한 편집자는 SF/판타지 분야에서 AI 소프트웨어에 대한 체계적인 규범을 구축하자고 제안하였습니다. 세부적으로는, AI 생성물을 다루기 위해 아래와 같은 범용적인 방법론을 제시하는 성명서를 발표했습니다.

AI 학습 데이터의 합법성 준수
AI 탐지 소프트웨어 효율성 향상 노력
AI 도구 사용 시 공개해야 할 정보 등

AI로 생성한 가수의 목소리

틱톡 이용자 ghostwriter977
Heart on My Sleeve라는 곡이 스포티파이, 애플뮤직, 아마존 뮤직 및 유튜브 뮤직 등 여러 음악 플랫폼에 공개되었습니다. 이 곡에는 유명 가수 Drake와 The Weeknd의 목소리가 포함되어 있었으나, 놀라운 점은 두 가수가 실제로 이 노래를 제작하지 않았다는 사실이었습니다. 이후 유니버설 뮤직 그룹(UMG)은 이 곡이 저작권 침해에 해당한다는 이유로 삭제를 요청했습니다.
David Guetta
자신의 최근 공연에서 AI 기술을 이용하여 에미넴(Eminem)의 스타일과 비슷한 노래를 선보였지만, 이를 상업적으로 발표할 계획은 없다고 하였습니다.
Grimes
최근 자신의 트위터에 내 목소리를 이용해서 성공적인 AI 커버곡을 만드는 경우에는 다른 아티스트와의 협업과 마찬가지로 로열티의 50%를 나누도록 하겠다고 밝힌 바 있습니다. 이는 AI 기술을 활용하여 자신의 목소리를 허락 없이 사용하는 것에 대해 저작권을 비롯하여 어떠한 법적 권리도 주장하지 않겠다고 밝힌 파격적인 사례였습니다. 이후 Grimes는 Elf.tech라는 소프트웨어 플랫폼을 새롭게 공개하였고, 자신의 팬들이 자유롭게 자신의 목소리를 이용하여 곡을 작업할 수 있도록 장려했습니다.