해외동향

Vol.40  2023. 02.

게시물 상세

 

애플의 AI 디지털 내레이션 출시와 오디오북 시장의 변화

 

 

 

류영호(교보문고 DBS플랫폼사업단 부장)

 

2023. 02.


 

최근 오디오북 시장과 기술의 변화

 

오디오 매체는 크고 다양한 범위에서 독자의 관심을 끌기 위해 종이책, 전자책과 경쟁하고 있다. 대부분의 출판업계 종사자들은 오디오북 점유율이 계속 증가할 것으로 예측한다. 미국출판협회(AAP)에 따르면, 2021년 미국 전체 도서 거래 수익의 8.1%가 오디오북에서 나왔다. 이 수치는 11.6%의 점유율을 보인 전자책에 비해 낮지만, 점유율 추세를 볼 때 머지않아 역전될 수 있다는 전망이 높은 편이다. 최근 오디오북 시장은 아마존, 구글, 애플 등 빅테크들의 투자 경쟁으로 급성장했다. 2022년 전 세계 오디오북 시장 매출액은 2021년 대비 25% 정도 급증해서 16억 달러(약 2조 320억 원)로 추정된다. 업계에서는 2030년까지 350억 달러(약 44조 4,500억 원) 규모 이상으로 시장이 확대될 것으로 보고 있다.

 

오디오북의 인기는 출판 비즈니스와 독서 문화를 변화시키고 있다. 그것은 사람들에게 새로운 방식으로 더 많이 읽을 기회를 제공하지만, 독서를 이해하는 방법에도 영향을 미친다. 오디오북으로 인해 사람들이 더 이상 책을 고르거나 읽는 행동에 적극적으로 참여하지 않고 다른 일을 하면서 부수적으로 오디오북을 듣는다는 점에서 결과적으로 독서에 부정적이라는 의견도 있다. 운전하고 잠을 자면서 오디오북을 듣는 것이 과연 독서라고 할 수 있을까, 라는 수동성을 지적하는 것이다.

 

미국 출판 시장에서 의미 있는 현상 중의 하나는 오디오북 스트리밍이 급증할 때 종이책 판매가 감소하지 않았다는 점이다. 아마도 오디오북은 종이책, 전자책과 경쟁하는 것이 아니라 주로 팟캐스트 또는 다른 오디오 매체와 경쟁하고 있는 것으로 보인다. 그렇다면 오디오북은 책 문화에 대한 위협이 아니라 방어자라고 할 수 있을 것이다. 논란이 있을 수 있지만, 오디오북이 우리의 독서 습관을 상당 부분 바꿀 수 있다는 점은 분명하다.

 

오디오북의 오랜 역사에 비해 실제 비즈니스로 성공하게 된 것은 지난 10여 년 내에 일어났다. 오디오북을 제작하는 일에서 판매하고 사용자들이 활용하기까지 일련의 프로세스에는 큰 변화가 없었다. 다만, 음성 합성 기술의 발달에 기인한 내레이션 비용 절감과 각종 제작 지원 정책으로 종이책으로 출간된 타이틀을 오디오북으로 제작하는 비용 부담이 줄어들었고, 스마트폰과 태블릿 PC 등 모바일 사용성이 강화된 플랫폼 환경과 구독형 판매 모델 등 사용자 편의성이 개선되면서 이것이 가능해졌다. 특히, 전문 성우와 내레이터를 통해 녹음하고 배경음 등을 믹싱하는 작업 과정에서 제작 비용과 시간이 많이 들었다. 물론, 오디오북 녹음 과정에서 전문 성우와 내레이터가 과도한 비용을 받는다는 뜻은 아니다.

 

오랫동안 소규모 출판사와 일반 작가들에게 오디오북 제작은 진입장벽이 높았고, 따라서 매력적인 타이틀 확보가 더디게 진행되면서 사용자의 관심도 적은 편이었다. 종이책이 전자책으로 변환되고, 전자책을 제작하는 데 드는 비용과 시간에 비해 오디오북은 개선과 발전이 상대적으로 더딘 느낌이 많았다. 각종 전자책 제작 프로그램이 출시되고 고도화되면서 전자책 제작 비용과 기술적 발전은 이미 최고 수준에 근접해 있다.

 

오디오북은 텍스트를 소리로 읽어내는 TTS(Text-To-Speech) 기술을 통해 제작 기간과 제작 비용의 제약을 극복하기 시작했다. 초기 TTS는 기계적으로 읽어내는 목소리가 전문 성우와 내레이터의 수준에 훨씬 미치지 못하면서 혹평받기도 했다. 기계를 통해 사람의 목소리를 내는 기술 실현은 매우 어려운 과제였지만, 프로그램 개발자들의 노력은 쉬지 않고 지속되었다.

 

애플, 인공지능 디지털 내레이션 출시

 

2023년 1월 애플 북스(Apple Books)에서 출시한 인공지능(AI) 기반의 디지털 내레이션(Digital narration)은 오디오북 제작과 사용성 확대에 큰 영향을 미칠 전망이다. “모든 책은 들을 가치가 있다”는 메시지와 함께 등장한 디지털 내레이션은 독립 작가와 소규모 출판사의 역량 강화를 목적으로 시작했다. 애플 북스는 점점 더 많은 사람들이 오디오북을 듣고 있지만, 대부분 출간된 책의 일부만 오디오로 변환하기 때문에 독자들이 타이틀을 선택하는 데 제한적이라는 것을 지적한다. 특히, 독립 저자, 혹은 소규모 출판사와 계약을 맺은 저자는 높은 제작 비용과 까다로운 제작 절차로 인해 오디오북을 제작하는 데 어려움이 많다. 이를 위해 애플 북스는 모든 사람이 오디오북 제작에 더 쉽게 접근하게 하고, 청취자들이 즐길 수 있는 타이틀을 더 많이 제공함으로써 증가하는 수요를 충족시킬 예정이다.

 

애플 북스 디지털 내레이션은 고급 음성 합성 기술과 언어학자, 오디오 품질 관리 전문가, 오디오 엔지니어팀이 함께 전자책(eBook) 파일에서 고품질의 오디오북을 생성한다. 애플은 오랫동안 혁신적인 음성 기술의 최전선에 있었고, 이제 그 기술력을 출판사, 작가, 내레이터와 함께 작업하면서 긴 형식의 읽기에 맞게 조정했다. 디지털 내레이션 타이틀은 전문 내레이션 오디오북을 보완하는 귀중한 자료가 된다.

 

디지털 내레이션의 ‘보이스(Voices)’는 특정 장르에 맞게 생성되고 최적화되고 있다. 현재 애플은 4개의 목소리를 제공하고 있다. 소설/로맨스 분야에서 사용할 수 있는 매디슨(Madison; 여성 소프라노 음색)과 잭슨(Jackson; 남성 바리톤 음색) 그리고 논픽션/자기계발 분야에서 사용할 수 있는 헬레나(Helena; 여성 소프라노 음색)와 미첼(Mitchell; 남성 바리톤 음색)이 있다. 디지털 내레이션으로 제작된 오디오북은 애플의 기준에 의해 도매 가격 책정이 제한되고, 애플 북스와 공공 및 학술 도서관을 통해서만 배포된다. 작가와 출판사는 해당 오디오북에 대한 저작권과 배타적 발행권을 보유하며, 애플 북스의 디지털 내레이션을 사용하지 않는 다른 버전의 오디오북을 제작하고 배포하는 데에는 제약이 없다.

 

한편, 애플은 자사와 협력한 파트너사를 통해서만 디지털 내레이션 프로그램을 제공하고 있다. 현재 파트너사로는 드래프트2디지털(Draft2Digital)과 인그램 코어소스(Ingram CoreSource) 두 곳이 있다. 작가 또는 출판사는 이 두 곳의 파트너사 중 선호하는 한 곳을 지정하여 디지털 내레이션을 이용할 수 있다. 그렇다면, 파트너사를 통해 디지털 내레이션을 활용할 수 있는 주요 조건과 프로세스를 살펴보자.

 

우선, 작가 또는 출판사에서 오디오북 제작에 대한 권리를 가지고 있는 전자책을 선정해야 한다. 이때 해당 전자책은 애플 북스에서 사용할 수 있어야 한다. 현재 제작 가능한 기본 카테고리는 로맨스 소설이며, 미스터리, 스릴러, SF, 판타지 장르는 지원되지 않는다. 전자책은 영어로 작성된 것만 가능하며, 파일의 품질, 콘텐츠 호환성(복잡한 형식 요소는 없으며, 제한된 외국어 단어 및 구문만 가능함) 및 편집 검토를 포함한 여러 기준에 따라 평가된다. 모든 책은 고유한 특성이 있어서 애플의 요구 사항을 충족하는 책이라도 세부 조건을 통과하지 못할 수 있다.

 

?

애플 스토어에서 “Narrated by Apple Books”로 표시된 오디오북 상세 화면
(출처: Apple Books for Authors, https://authors.apple.com/support/4519-digital-narration-audiobooks)

 

 

오디오북으로 제작 가능한 타이틀로 선정된 책은 장르에 맞는 샘플을 듣고 어떤 유형의 목소리가 가장 잘 어울리는지 선택하면 된다. 해당 오디오북은 애플 스토어에서 “애플 북스의 AI 내레이션(Narrated by Apple Books)”으로 표시된다. 이어서, 오디오북 표지를 선택하면 되는데 표지 요구 사항을 충족하는 경우 맞춤 표지를 제공한다. 사용자가 직접 만든 표지를 제출하지 않으면 애플은 표지 색상과 사용자 정의 배경 등을 추가해서 직사각형 전자책 표지를 정사각형 오디오북 표지로 변환한다. 이후, 오디오북에 대한 매력적인 설명을 추가해서 파트너사에 제출한다. 제출 후에 오디오북 제작을 처리하고 품질 검사를 수행하는 데 1~2개월 정도가 소요된다. 디지털 내레이션 오디오북이 애플 스토어의 품질과 콘텐츠 표준을 충족하는 경우 스토어에 정식으로 등록된다.

 

인공지능과 오디오북의 결합에 대한 논란과 전망

 

출판업계에서는 인공지능이 낭독하는 오디오북의 성공 여부를 놓고 시각이 갈리고 있다. 꽤 오랜 기간 여러 시도와 평가가 지속될 전망이다. 애플 디지털 내레이션은 인간이 읽는 스타일을 학습한 디지털 음성이 적용된 것이다. 샘플 오디오를 들어본 초기 사용자들의 전반적인 반응은 사람이 읽어주는 느낌과는 차이가 크다는 지적이다. 기술 전문매체 아르스 테크니카(Ars Technica)는 “사람이 읽어주는 열정적인 행위를 대체할 수 없을 것”이라고 평가했다. 출판업자 칼리 워터스(Carly Watters)는 “업체들이 오디오북 시장을 보고 돈이 될 것이라고 생각해서 콘텐츠를 만들려고 하지만, 그러한 오디오북은 고객이 듣고 싶은 게 아니다. 사람이 읽는 내레이션과 스토리텔링에는 매우 큰 가치가 있다”고 주장했다.

 

이렇게 비용 절감, 더 빠른 생산을 위한 혁신으로 도입된 디지털 보이스 때문에 오디오북 독자들에 디지털 혁신의 경험을 제공한다는 기대감도 많이 있다. 인공지능 음성 기술이 발전함에 따라 사람의 육성에 최대한 근접할 것이고, 더 다양한 언어와 음성 지원이 가능해지면 지식정보에 대한 편리한 습득과 새로운 비즈니스 기회 창출도 뒤따를 전망이다. 이러한 기술은 출판 시장에서 롱테일(Long tail)에 속하는 여러 책들을 저렴한 비용으로 빠르게 오디오북으로 제작할 수 있게 한다.

 

아마존이 인수한 오더블(Audible)이 여전히 세계 오디오북 시장을 이끌어가고 있고, 유럽에서는 오디오북 전문 플랫폼 스토리텔(Storytel)의 빠른 성장이 계속해서 주목받고 있다. 세계 최대 음원 및 팟캐스트 플랫폼 스포티파이(Spotify)도 2021년 오디오북 플랫폼 파인드어웨이(Findaway)를 인수했고, 2022년에는 미국의 이용자들을 위한 오디오북 서비스를 출시했다. 틱톡으로 유명한 바이트댄스도 2020년 오디오북을 서비스하는 중국 최대 전자책 기업인 장위에(Zhangyue)에 1억 7,000만 달러를 투자했고, 인공지능 오디오북 애플리케이션도 출시했다. 구글도 구글플레이(Google play)에서 인공지능 기반의 오디오북 해설을 제공하고 있다. 디지털 소설 작가를 위한 자동 해설 오디오북으로 영어와 스페인어, 프랑스어, 독일어, 포르투갈어를 지원한다.

 

이렇게 여러 테크 기업들의 오디오북 시장 진출과 대대적인 투자는 출판산업 전반에 활력을 불어넣고 있다. 스마트폰, 스마트 스피커, 블루투스(Bluetooth) 무선 이어폰/헤드폰 등이 보편화되면서 오디오북 사용도 과거에 비해 훨씬 편리해지면서 미디어 간 경쟁은 더욱 치열해졌다. 나아가 디지털 기반의 번역 기술이 향상되면서 다양한 언어로 제작된 수많은 책에 대한 접근성이 좋아졌다. 이에 디지털 내레이션 기술을 통해 이용 가능한 오디오북 콘텐츠의 양도 상당히 많아질 것이다. 물론, 이러한 비즈니스 모델과 서비스 운영을 위해서는 합법적인 저작권 계약 관계가 선행되어야 한다.

 

최근 국내에도 인공지능 기술을 오디오북과 오디오 콘텐츠 사업에 적용하는 사례가 증가하고 있다. 구독형 독서 플랫폼 밀리의 서재는 KT에서 출시한 음성 합성 서비스 ‘AI 보이스 스튜디오(AI Voice Studio)’를 활용한다. 약 100개의 인공지능 목소리를 통합해서 다양한 감정으로 합성할 수 있는 것이 특징으로 현재 한국어, 영어, 중국어, 일본어, 스페인어 등을 지원한다. 이어서 출시한 ‘마이 AI 보이스(My AI Voice)’는 나만의 AI 목소리를 제작할 수 있는 서비스다. 30개 정도의 예시 문장을 녹음하면 내 목소리와 닮은 인공지능 음성을 만들어준다. 밀리의 서재는 이 기능을 활용해서 구독자가 직접 만드는 방식의 오디오북을 선보일 예정이다. 오디오북 전문 플랫폼 윌라는 고품질 인공지능 음성 합성 엔진 개발 및 고속 재생 시 오디오 품질 고도화 등을 위한 연구 프로젝트를 한양대학교와 함께 진행했다. 목소리 흉내에 그치지 않고, 다양한 고난이도 어휘와 문장을 정확하게 읽을 수 있는 음성 합성 엔진 개발을 목표로 두었다. 고속 재생 시 음질의 깨짐이나 부정확성을 최소화하는 기술 개발도 병행하고 있다. 이를 통해 오디오북 서비스 경쟁력 강화와 함께 인공지능 음성 합성 비즈니스 확장을 추진한다.

 

종합적으로 볼 때, 애플의 인공지능 디지털 내레이션은 오디오북 시장을 본격적으로 재편시킬 변곡점이 될 것으로 보인다. 애플의 플랫폼 영향력과 디지털 기술을 통한 오디오북의 제작, 유통, 소비의 활용성은 오디오북 대중화에 가속도를 붙일 수 있기 때문이다. 그렇다고 전문 성우나 내레이터 등 사람이 읽는 오디오북이 위축되거나 사라지는 경우는 없을 것이다. 오히려 고품질을 지향하면서 더 풍부한 감성을 연출하는 오디오북 제작을 통해 차별화를 만들어낼 수 있다. 결국, 기술의 진화는 산업의 효율성을 향상시킬 수 있는 중요한 수단이며, 이를 가치 있게 사용하고 혁신적인 비즈니스를 만들어가는 것은 사람의 역할이다. 앞으로 세계 오디오북 시장도 아날로그와 디지털, 사람과 기술이 적절한 균형을 갖추면서 성장할 수 있도록 출판계의 관심과 변화가 더욱 요구되는 시점에 있다.

 

류영호 교보문고 DBS플랫폼사업단 부장

주로 신사업개발·전략기획·대외제휴 업무를 담당했으며, 제21회 한국출판평론상을 수상했다. 저서로 『아마존닷컴 경제학』, 『출판혁신전략』, 『세계 전자책 시장은 어떻게 움직이는가』, 『출판혁명』이 있다.
bookerslab@gmail.com
www.facebook.com/ryuyoungho75

 

해외동향 다른 기사보기 View More