출판탐구

Vol.31  2022. 04.

게시물 상세

 

인공지능 학습에서의 저작물 이용에 대한 소고

 

 

 

김창화(한밭대학교 공공행정학과 부교수)

 

2022. 4.


 

인공지능의 저작물 이용과 저작권 보호의 충돌

 

최근 대부분의 인공지능 학습은 기계학습(Machine Learning)으로 구현되며, 주어진 데이터를 통해 학습하는 지도·비지도 학습과 데이터를 주지 않고 시뮬레이션으로 학습하는 강화 학습이 있다. 딥러닝(Deep Learning)도 기계학습의 일부이며, 빅데이터와 컴퓨팅 파워가 발전되면서 그 성과가 높아지고 있다. 이러한 인공지능 학습은 자가 학습으로 이루어져 인간의 개입 여지가 많지 않으며, 데이터를 잘 주거나 보상 정책을 잘 만드는 것이 필요하다. 이처럼 데이터는 인공지능의 학습에서 필수적인 요소이기에, 인공지능 산업의 활성화를 위해서는 자유로운 데이터의 이용이 무엇보다 중요하다. 그런데 데이터가 저작권의 대상인 저작물인 경우에는 법적 예외 사유가 존재하지 아니하는 한, 저작권자의 동의 없이는 저작물을 이용할 수 없다. 여기서 인공지능의 저작물 이용과 저작물에 대한 저작권 보호라는 양자의 이익이 충돌하게 되고, 이에 대한 조정이 필요하게 된다.

 

인공지능의 학습과 저작권의 침해

 

데이터를 이용하는 기계학습은 데이터(여기서는 저작물을 포함하는 개념으로서의 데이터로 사용하기로 한다. 이하 같다.)로부터 모델을 만드는 단계가 필요하며, 데이터 수집, 데이터 전처리, 데이터 학습, 모델 평가의 4단계로 나뉜다.1)

 

먼저, 데이터 수집 단계에서는 공개된 데이터 소스에서 원하는 데이터를 가져오거나 직접 데이터를 수집할 수 있다. 이 경우 자유로운 이용을 허용하는 표시나 조건이 있지 않은 한 타인의 데이터를 수집 즉, 내려 받거나 복제하여 저장하는 것은 복제권 침해를 발생시킨다. 이러한 복제권의 문제는 전 주기에서 문제될 수 있다. 일시적 복제도 문제될 수 있으나, 이에 대해서는 면책 규정이 별도로 마련되어 있다.2) 다음으로, 좋지 못한 데이터를 스크리닝하거나 빠진 데이터를 채워주는 등의 정리를 하는 저작물 전처리 과정을 거친다. 여기서는 데이터 변환 등이 발생하여 복제권 문제와 더불어 개작에 대한 저작권자의 동일성유지권이나 2차적저작물작성권이 문제될 수 있다. 마지막으로, 학습 방법과 알고리즘을 선택하여 모델을 완성하고 모델을 평가하는 단계는 저작물을 실질적으로 이용하는 과정으로서 그 이용의 유형에 따라 개별 저작권에 대한 침해의 문제가 발생할 수 있다.

 

저작권법은 저작물 이용에 대해 저작권자의 허락 없이도 가능한 경우를 규정하고 있는데, 이를 저작권 제한 또는 침해에 대한 면책이라고 부른다. 인공지능 학습에서의 저작물 이용에 대한 면책은 저작권법이 아직 개별적인 규정을 도입하지 않았기 때문에, 저작권법 제35조의5의 일반 공정이용 규정에서의 면책으로 판단할 수 있다. 본 규정에서의 공정이용을 만족하기 위해서는 저작물의 이용이 저작물의 통상적인 이용 방법과 충돌하지 아니하고 저작자의 정당한 이익을 부당하게 해치지 아니하여야 한다. 이는 4요소의 판단으로 결정할 수 있다.3) 공정이용의 최신 판단 경향에 따를 때, 인공지능 학습에서의 저작물 이용은 원래 저작물과는 다른 목적으로 새로운 가치를 부여한 것이어서 변형적 이용에 해당한다. 그리고 학습이라는 특성은 원저작물과의 현재 시장이나 잠재적 시장에 큰 영향을 미치기 어려워 공정이용에 해당할 가능성이 다소 크다고 보인다.

 

하지만 이러한 공정이용의 판단은 구체적 사실에 따라 그 결과가 달라지고, 주관적인 해석을 피하는 명백한 기준 법칙(bright line rule)을 따르기보다는 4가지 요소를 종합적으로 고려하는 방법을 취하고 있어, 그 판단의 결과를 예측하기가 쉽지 않다. 공정이용의 중요한 2가지 판단 요소 중 하나인 변형성도 사안에 따라 해석이 많이 달라질 수 있음을 최근의 사례들에서 자주 볼 수 있다.4) 그리고 다른 요소인 잠재적 시장에 대한 피해도 잠재적 시장을 라이선스를 위한 이론적 시장으로 가정하게 되면 모든 저작권자가 잠재적 시장의 손실을 겪을 수밖에 없는 결론에 이르는 문제가 있다. 따라서 인공지능 학습에서의 저작물 이용이 공정이용에 해당한다고 보장할 수는 없으며, 이는 여전히 인공지능 학습에서의 저작물 이용을 어렵게 한다.

 

균형의 방향, 범위, 방법

 

이러한 충돌을 해결하기 위해서는 인공지능과 저작권 산업 양자를 위한 균형점을 찾아야 하는데, 이는 저작권법이 기술과의 전쟁 역사 속에서 적용해왔던 저작권법의 목적과 다른 원칙들에서 찾을 수 있다. 우선, 저작권법의 목적에 비추어 볼 때, 그 균형점은 인공지능의 저작물 이용이 저작권 보호보다 우선하는 지점에서 결정되도록 한다. 저작권법의 목적은 궁극적으로 문화산업 발전이고, 저작권의 보호는 그 목적을 위한 수단이다. 따라서 저작권의 보호와 이용에 대한 균형점이 분명하지 않을 때, 저작권법은 공중이 더 많은 저작물에 쉽게 접근할 수 있도록 하고, 자유롭게 이용할 수 있도록 하며, 이를 통해 새로운 저작물이 만들어질 수 있도록 해야 한다. 그것이 저작권법의 목적과 부합하게 된다.5) 이 외에도 여러 저작권 관련 원칙들은 저작권의 보호보다는 저작권 산업 전체를 발전시키는 방향으로 이익의 균형점을 찾도록 하고 있다.6) 따라서 균형점의 방향은 인공지능의 저작물 이용이 가능한 쪽으로 기울 것이다. 다만, 그 균형점의 한계는 저작권자의 이익을 부당하게 해치지 않는 한도 이내여야 한다.

 

이익 균형점의 방향이 저작물의 이용을 허락하는 것이라면, 다음으로 세부적인 한계점을 정해야 하고, 이는 허락의 범위에서 정할 수 있다. 그 범위는 저작권자 허락 없이 인정되는 이용 범위이며, 그 이용의 목적이나 유형 두 가지 부분에서 정할 수 있다. 먼저, 이용의 목적 즉, 영리성과 관리하여 인공지능이 영리 산업에서 현재 활용되고 있고, 그 필요성이 높다는 것을 고려할 때 비영리적 목적에 한정하는 것은 실효성이 높지 않아 보인다. 그리고 영리적인 경우를 포함하는 것이 법률관계를 명확하게 할 수 있어 영리적인 경우를 포함하는 것이 타당해 보인다. 다만, 영리적 이용을 허락하더라도 저작권자의 이익을 지나치게 훼손하지 않는 범위 내여야 하며, 상황에 따라 사후 보상의 방법이 고려될 수 있다. 다음으로, 이용의 유형에서, 학습을 위한 과정에서 발생하는 복제나 전송은 본래의 목적인 향유를 전제로 하는 것이 아니라면 학습을 위해 반드시 필수적인 부분이어서 허용되어야 할 것이다. 문제는 2차적저작물작성 즉, 개작인데 저작권법 제45조 제2항의 저작재산권 양도 규정에서 프로그램에 2차적저작물작성권을 포함하듯, 변형이 쉽게 예측되고 그 필요성이 높으며, 해당 절차가 필연적일 때에는 개작의 필요성이 높아 인정해야 할 것으로 보인다.

 

면책의 방법으로는 미국처럼 공정이용 규정을 적용하는 방법과 유럽이나 일본처럼 입법을 통하는 방법이 있다. 유럽은 영국이나 독일에서 세부적인 면에 차이가 있기는 하나, 비상업적 목적의 복제에만 한정되어 데이터 이용에 대한 면책을 허용한다. 일본은 이용의 주체에 대한 제한도 없고, 저작물이 본래의 목적으로 사용되지 않는 한, 그 목적이나 방법에 제한을 두고 있지 않다. 우리는 공정이용에 대한 일반 규정 외에 구체적 사유에 대한 공정이용 규정을 두고 있는 점을 고려할 때, 구체적 제한 규정을 두는 것이 바람직해 보인다. 최근 제안된 저작권법 전부개정안은 “컴퓨터를 이용한 자동화 분석기술을 통해 다수의 저작물을 포함한 대량의 정보를 분석(규칙, 구조, 경향, 상관관계 등의 정보를 추출하는 것)하여 추가적인 정보 또는 가치를 생성하기 위한 것으로 저작물에 표현된 사상이나 감정을 향유하지 아니할 때에는 필요한 한도 안에서 저작물을 복제·전송할 수 있다”고 규정하고 있어 유럽과 일본의 중간 정도가 되는 태도를 보이는 것으로 볼 수 있다. 향후, 입법과 법원의 해석을 통해, 면책의 더 명확한 모습이 정해질 것으로 보인다.

 

균형 방안의 보완

 

인공지능 학습에서의 저작물 이용은 결국 저작권법의 개정으로 문제가 해결될 것으로 예상되지만, 이러한 해결은 저작권자 측에만 다소 불리하다고 느낄 수도 있어, 저작권자의 반발을 살 수도 있다. 따라서 이를 보완하는 방안으로서 저작권보상금의 도입과 저작물의 이용 방식에 대한 변화가 필요하다고 보인다.

 

우리 저작권법의 저작재산권 제한 규정들은 저작권자의 허락 없이 저작물을 이용할 수는 있지만, 그 이용에 대하여 대가를 지급하지 않는 경우와 보상하는 경우로 나누어진다. 보상하는 경우는 교육 목적을 위한 저작물의 이용과 도서관에서의 이용이 있으며, 이는 협의의 법정허락으로서 비자발적 이용 허락이며, 그 보상은 저작권 사용의 대가가 된다. 독일의 경우에는 저작권자의 합법적인 이익을 부당하게 해치지 않기 위해, 원칙적으로 보상금을 지급하도록 하고, 예외적으로 무상으로 이용할 수 있도록 하고 있다.7) 인공지능 학습에서의 저작물 이용은 앞서 살펴본 바와 같이, 저작권 원칙상 저작권 제한 사유가 되어야 하고, 그 범위와 유형도 다소 넓게 인정될 필요가 있다고 하였다.

 

따라서 저작권자의 이익이 훼손되지 않는 범위로 인정되기에는 다소 부족함이 보인다. 공평의 견지에서, 분쟁을 미리 방지하고, 양자가 협력할 수 있도록 저작권자의 이익을 보상해주는 것이 필요해 보인다. 최근 기사들에 의하면, 인공지능 업체들은 규제 완화보다는 명확한 기준이 빨리 제시되기를 바라고 있으며,8) 그렇다면 자유롭게 저작물을 이용하고 그에 대한 이용의 대가를 사후에 지급하도록 하는 것이 인공지능과 저작권 양자를 모두 보호할 수 있는 가장 바람직한 방법이 되지 않을까 생각된다.

 

또한, 현재 저작물의 이용 방식은 옵트-인 방식으로서, 저작물을 이용하기 위해서는 저작권자의 명시적인 허락이 필요하다. 이러한 방식은 본래 공개 시스템으로 만들어졌고, 접근금지를 하지 않는 한 자유롭게 접근할 수 있도록 한 인터넷에 적합하지 않다. 예로써, 검색엔진이 옵트-인 방식에서 검색을 수행하게 되면, 수많은 저작권자에게 일일이 허락받아야 하기에 그 비용과 노력이 엄청나서 운영하기가 어렵다.

 

따라서 온라인에서의 저작물 이용은 저작물의 이용을 거부하지 않는 한 저작권자의 허락 없이도 저작물을 이용할 수 있는 옵트-아웃 방식을 도입할 필요가 있다. 옵트-아웃은 그 구조가 간단하여 채용하기 어렵지 않고, 비용도 거의 들어가지 않는다. 저작권자는 저작물 이용에 반대하지 않으면 아무런 조치를 하지 않고, 반대하는 경우에만 쉬운 방법으로 의사를 표시함으로써 이를 막을 수 있다. 인공지능 학습에서도 해당 저작물이 이용되기를 원하지 않는 때에는 이를 표시하여 알려주고, 그 외에는 자유로운 이용이 가능하게 하는 것이다. 이로써 면책 규정이 없더라도 원활한 저작물 이용을 보장하여 분쟁을 미리 방지할 수 있게 하고, 이해가 충돌하더라도 쉽게 해결할 수 있도록 할 것이다.

 

마치며

 

인공지능 학습에서의 저작물 이용은 인공지능 산업을 활성화하기 위한 필요조건이기 때문에, 자유로운 이용을 보장해야 한다. 하지만, 허락 없는 저작물의 이용은 저작권 침해를 구성하고, 저작권자의 이익을 일방적으로 희생시키면서 이를 강제할 수는 없다. 따라서 적절한 균형점이 필요하며, 그 균형의 방향은 저작권법의 원칙상 인공지능의 저작물 이용에 대하여 저작권을 제한하는 것이 타당하다. 그 이용의 범위는 현실을 반영하고, 효율적 운영을 위하여 영리적 목적을 허용해야 한다. 또한 복제와 전송뿐만 아니라 개작까지 포함해야 하며, 제한의 방법은 별도의 구체적 제한 규정을 둘 필요가 있다.

 

하지만, 이러한 저작권의 제한도 저작권자의 이익을 훼손하지 않는 범위 내에서 이루어져야 한다. 따라서 자유로운 이용은 허용하되 사후에 그에 대한 보상을 할 수 있도록 하는 보상금제도의 도입이 필요해 보인다. 면책 규정이 없더라도 저작물 이용을 쉽게 할 수 있게 하기 위해 온라인에서의 저작물 이용 방식을 옵트-아웃으로 변화시키는 것을 또한 제안해 본다.

 

 

1)
2)
저작권법 제35조의2.
3)
① 이용의 목적 및 성격, ② 저작물의 종류 및 용도, ③ 이용된 부분이 저작물 전체에서 차지하는 비중과 그 중요성, ④ 저작물의 이용이 그 저작물의 현재 시장 또는 가치나 잠재적인 시장 또는 가치에 미치는 영향.
4)
공정이용의 불인정으로서의 Andy Warhol Found. for the Visual Arts, Inc. v. Goldsmith, 공정이용의 인정으로서 Google v. Oracle, Carious v. Prince 등이 있으며, 유사한 사실인 경우에도 다른 결과를 낳기도 하였다.
5)
Craig Joyce & L. Ray Patterson, Copyright in 1791: An Essay Concerning the Founders’ View of the Copyright Power Granted to Congress in Article I, Section 8, Clause 8 of The U.S. Constitution, 52 Emory L.J. 909, 940 (2003).
6)
소비자주의(consumerism)에서의 긍정적 능동적 소비자주의나 반독점법에서의 기술에 의한 잠재적 혜택은 모두 저작권의 단순한 보호가 아닌 저작권법 본연의 목적을 달성하는 방안을 제시하고 있다.
7)
김병일 외 4인, 저작권보상금 제도 종합연구, 한국복제전송저작권협회, 2016, 7-8면.
8)

김창화

 

김창화(한밭대학교 공공행정학과 부교수)

미국 Wisconsin 대학교에서 지식재산법으로 박사 학위를 받고, 현재 한밭대학교 공공행정학과 부교수로서 지식재산법 연구와 강의를 하고 있다. 주요 연구로는 ‘와해성 이중용도 기술의 보호’, ‘저작권 침해에 있어 기술의 책임에 대한 판단’, ‘데이터 마이닝과 저작권 면책의 범위 및 한계’ 등이 있다.
patzzang@hanbat.ac.kr

 

출판탐구 다른 기사보기 View More