전체기사 최신뉴스 GAM
KYD 디데이
경제 과학기술

속보

더보기

[기고] AI 시대의 새로운 도전 : 데이터 고갈과 저작권의 딜레마

기사입력 : 2024년11월19일 15:10

최종수정 : 2024년11월19일 15:10

AI 학습 데이터의 공정 이용 논의 활발
한국의 고품질 콘텐츠 활용 기회 예상
AI 기본법 통과 후 한국형모델 마련 필요

인공지능(AI) 기술이 급속도로 발전하면서 예상치 못한 새로운 위기가 찾아왔다. 바로 AI를 학습시킬 양질의 데이터가 고갈되고 있다는 것이다.

챗GPT와 같은 거대 언어모델이 등장한 이후, 전 세계 AI 기업들은 더 나은 성능을 위해 양질의 데이터를 찾아 헤매고 있다. 그러나 이미 인터넷상의 고품질 데이터는 대부분 소진된 상태다.

이러한 데이터 고갈 현상의 핵심에는 저작권 문제가 있다. 양질의 텍스트 데이터는 대부분 책, 논문, 전문 기사 등 저작권으로 보호받는 콘텐츠다. 유럽연합(EU)과 미국에서는 AI 학습을 위한 데이터 사용이 공정 이용(fair use)에 해당하는지에 대한 법적 논의가 활발히 진행되고 있다.

김현철 한국인공지능협회장 [사진=한국인공지능협회] 2024.10.23 biggerthanseoul@newspim.com

한국어와 같은 비영어권 언어의 경우 상황은 더욱 심각하다. 영어는 그나마 공개된 데이터의 양이 방대하지만, 한국어의 경우 양질의 데이터를 확보하기가 매우 어렵다.

이에 대응해 일부 AI 기업들은 데이터 제공자들과 라이선스 계약을 맺기 시작했으며, 블록체인 기술을 활용한 저작권 보호 및 보상 시스템도 제안되고 있다.

각국은 이 문제 해결을 위해 다양한 시도를 하고 있다. EU는 AI Act를 통해 AI 학습 데이터의 투명성을 요구하고 있다.  미국에서는 AI 학습을 위한 데이터 활용을 공정 사용의 범주로 포함시키려는 논의가 진행 중이다. 일부 AI 기업들은 데이터 제공자들과의 직접적인 계약을 통해 문제를 해결한다.

주목할 만한 것은 합성 데이터(Synthetic Data) 활용이다. 그러나 이 역시 법적 문제를 완전히 해결하지는 못하는 한계가 있다. 결국 근본적인 해결책은 데이터 제공자와 AI 기업 간의 새로운 협력 모델을 만드는 것이다.

한국 정부도 이 문제의 심각성을 인식하고 있다. 문화체육관광부와 한국저작권위원회는 AI저작권에 대한 가이드라인을 발표했으며, 정부는 민간 주도의 클라우드 산업 확대를 통해 AI 경쟁력을 강화하려는 계획을 추진중이다.

더욱 주목할 점은 한국이 가진 특별한 기회다. 우리나라는 세계적 수준의 고품질 콘텐츠를 보유한 문화 강국이다. K-문학, K-드라마부터 전문적인 학술, 의료, 법률 자료까지, 질적으로 우수한 한국어 데이터가 풍부하다. 이러한 자산들을 AI 학습에 활용할 수 있는 체계를 구축한다면, 글로벌 AI 시장에서 독보적인 경쟁력을 확보할 수 있다.

이러한 가능성을 실현하기 위해서는 제22대 국회의 인공지능 기본법이 조속히 통과돼야 한다. 인공지능 기본법이 시행되면 저작권과 AI 발전이 공존할 수 있는 체계를 마련하는 토대가 될 수 있으며, 데이터 중개 플랫폼과 데이터 활용 동의 시스템도 법적 근거 하에 구축될 수 있다. 이 법안은 AI 산업의 미래를 위한 핵심적인 첫걸음이 될 것이다.

이 문제를 해결하기 위해서는 저작권 제도와 AI 발전이 상생할 수 있는 새로운 모델이 필요하다. 가장 현실적인 방안은 저작권 등록 시스템에 'AI 학습 동의' 옵션을 도입하는 것이다. 저작권자가 자신의 콘텐츠를 AI 학습에 활용하는 것을 사전에 동의하고, 이에 따른 적절한 보상을 받을 수 있는 체계를 만드는 것이다.

이를 위해서는 저작권 데이터의 등록과 거래, 수익 분배를 전문적으로 관리할 수 있는 중개 플랫폼이 필요하다. 이러한 플랫폼은 저작권자의 권리를 보호하면서도 AI 기업들이 필요한 데이터를 효율적으로 확보할 수 있게 해주는 중요한 역할을 할 수 있다. 

챗GPT가 그린 데이터센터의 모습 [사진=챗GPT]

이러한 체계가 성공적으로 구축된다면, 한국은 데이터 경제의 새로운 장을 열 수 있다. 단순히 AI 기술의 발전을 넘어, 저작권자의 권리 보호와 수익 창출, AI 기업의 기술 혁신이 선순환하는 새로운 경제 생태계를 만들 수 있는 것이다.

더 나아가 이러한 한국형 모델은 글로벌 표준이 돼야 한다. 저작권 보호와 AI 발전의 조화, 공정한 데이터 거래와 수익 분배 등 이 모든 것을 아우르는 혁신적인 모델을 한국이 먼저 제시해야 한다.

AI 시대에서 데이터는 새로운 원유라고 불린다. 그러나 무분별한 데이터 수집과 활용은 저작권 침해와 같은 심각한 문제를 야기할 수 있다. 동시에 지나친 저작권 보호는 AI 발전을 저해할 수 있다.

우리에게 필요한 것은 이 두 가치가 조화를 이루는 새로운 체계다. 저작권 등록 시스템의 혁신과 데이터 중개 플랫폼의 구축은 그 첫걸음이 될 수 있다. 각국의 사례와 시도들은 이미 이러한 변화의 필요성을 보여준다. 이제 한국이 이 분야에서 선도적인 모델을 제시할 때다.

◇ 김현철 한국인공지능협회장은 1984년 서울 출신으로, 머신러닝 기반 추천 알고리즘 개발회사 대표를 역임했다. 2017년 (사)한국인공지능협회 사무총장을 맡으면서 협회를 설립, 국내 최초 250개 인공지능 기술기업 클러스터를 구축하고, 전자정부 사업 '혁신성장첨단기술전' 공동주관, 국제인공지능대전 개최, 인공지능 경진대회, KOREA AI Startups 편찬 등을 추진하며 협회 발전에 기여했다. 2019년부터 현재까지 협회장을 맡고 있다.

[뉴스핌 베스트 기사]

사진
뉴스핌 K컬처 플랫폼 'K·SPOT' 론칭 [서울=뉴스핌] 양진영 기자 = 종합뉴스통신사 뉴스핌이 K컬처 전문 글로벌 플랫폼 'K·SPOT' 유튜브 채널(https://www.youtube.com/@K%C2%B7SPOT_newspim)을 17일 공식 론칭했다. 'K·SPOT(@K·SPOT_newspim)'은 한국의 생생한 K컬처 현장을 전 세계에 전하는 K컬처 글로벌 플랫폼으로 영어·중국어·일본어 등 다국어 자막 서비스를 통해 글로벌 소통력을 강화한 것이 특징이다. 'This is K·SPOT – where K-culture comes alive.'라는 슬로건 아래, KPOP, K드라마, K라이프 등 한국 대중문화(K컬처) 전반을 조명한다. 특히, 전 세계의 언어 장벽을 허무는 다국어 자막 시스템을 기반으로 글로벌 팬층과의 연결을 강화했으며, 영어, 중국어, 일본어 지원과 함께 추후 스페인어, 힌디어 등 주요 언어로 확장할 예정이다. 채널명 'K·SPOT'은 한국(K) 문화의 중심 '스팟'을 의미하며, K컬처가 살아 숨 쉬는 현장에 스포트라이트를 비춘다는 의미를 담았다. K-컬처를 실시간으로 소비하는 글로벌 팬들과 그 현장을 연결하는 플랫폼으로 콘텐츠 소비의 지리적·언어적 경계를 허물며, KPOP 쇼케이스, 드라마 제작발표회 등 전 세계 팬들이 궁금해하는 바로 그 현장을 경험할 수 있는 디지털 K컬처 허브를 지향한다.  K·SPOT에서는 K라이징스타 힛지스를 시작으로 대중문화, 예술 분야 예비 스타들을 전 세계에 소개하며 다양한 K컬처 콘텐츠들도 두루 만나볼 수 있다.  ◆생생한 K-컬처 현장을 전달하는 글로벌 플랫폼 K·SPOT은 단순한 영상 채널을 넘어, 전 세계 어디서든 K컬처를 실시간으로 즐길 수 있도록 설계된 글로벌 플랫폼이다. 영어, 중국어, 일본어 등 다국어 자막 서비스를 제공해 언어 장벽을 낮추고, 다양한 문화권의 팬들이 동시 접속해 K-컬처를 함께 알아볼 수 있다. 'K·SPOT(@K·SPOT_newspim)' 채널 로고. 검색 뿐만 아니라 , 무음 시청·청각 장애인 접근성 향상 등도 도모할 예정이다.  뉴스핌은 K·SPOT은 단순한 K컬처 소개 채널에 머물지 않고, 다양한 언어와 콘텐츠 포맷을 아우르는 글로벌 문화 플랫폼으로 키울 예정이다. K컬처 심장부를 세계와 연결하며 글로벌 콘텐츠 생태계의 중심으로 도약한다는 계획이다. K·SPOT에서는 K컬처 모든 현장을 생생하게 포착하고, 전 세계 팬들과 소통하며, 디지털과 현실을 연결하는 진정한 K-컬처 허브로 자리매김할 계획이다. jyyang@newspim.com 2025-07-17 01:00
사진
충남 서산 시간당 114㎜ 폭우 [세종 = 뉴스핌] 김범주 기자 = 충청권과 중부지방을 중심으로 시간당 최대 100㎜가 넘는 강한비가 내리면서 주민 1070명이 대피하는 등의 피해를 입었다. 31개 항로에서 39척의 여객선이 운행을 멈췄고, 서울 등 90구역 하천변이 통제됐다. 중앙재난안전대책본부(중대본)는 17일 오전 10시 기준으로 이 같은 피해가 발생했다고 밝혔다. 호우경보는 세종, 충북, 충남, 경남에, 호우주의보는 서울, 대전, 광주, 경기, 강원, 전북, 전남 등에 각각 발효됐다. 전날 자정부터 이날 오전 10시까지 총 누적 강수량은 충남 서산이 가장 많은 419.5㎜로 집계됐다. 이어 홍성 411.4㎜, 당진 376.5㎜ 아산 349.5㎜, 태안 348.5㎜, 세종 324.5㎜, 충북 청주 276㎜, 경기 평택 262㎜ 등 이었다. 60분 기준 일최대 강수량은 서산 114.9㎜, 홍성 96.2㎜, 서천 98㎜, 경남 함안 70㎜ 등이었다. [서울=뉴스핌] 김학선 기자 = 서울에 폭우가 내리고 있는 17일 오전 서울 서초구 서울고검에서 청사 관계자들이 우비를 입고 이동하고 있다. 2025.07.17 yooksa@newspim.com 해당 지역을 중심으로 산사태 예보 발령도 발효됐다. ▲세종 ▲경기(평택, 안성) ▲충북(진천) ▲충남(천안, 공주, 보령, 아산, 서산, 논산, 당진, 부여, 청양, 홍성, 예산, 태안) 등 16개 지역에 경보가 내려졌다. 인명피해는 경기 1명, 충남 1명으로 집계됐다. 옹벽붕괴 1건, 도로 토사유실 2건 등으로 공공시설의 피해도 있었다. 이번 집중호우로 3개 시·도, 5개 시·군에서 313세대 1070명이 일시적으로 대피하는 피해도 발생했다. 아직 287세대 1041명이 귀가하지 못하는 것으로 집계됐다. 집중호우 지역 중심으로 통제도 있었다. 목포와 홍도, 격포와 위도, 군산과 어청도를 잇는 여객선이 통제됐다. 북한산 97개, 지리산 39개, 속리산 24개, 월악산 24개 등 총 15개 국립공원 374개 구간에서 시설 통제도 있었다. 지하차도는 충북 5개, 충남 5개, 경기 2개 등에, 도로는 인천 1개, 세종 1개, 경기 3개, 충북 1개, 충남 2개 등에 각각 통제가 이뤄졌다. [서울=뉴스핌] 류기찬 인턴기자 = 서울에 강한 비가 내리고 있는 17일 오전 서울 종로구 광화문광장 일대에서 시민들이 이동하고 있다. 2025.07.17 ryuchan0925@newspim.com 한편 중대본은 이날 오전 4시부로 중대본 1단계에서 2단계로 격상하고, 기상 상황을 실시간으로 모니터링 중이다. 또 환경부, 산림청과 같은 관계 부처와 협업을 강화해 비상근무 체제를 유지하기로 했다. 특히 서산, 당진, 태안 등 강수가 집중되고 있는 지역에는 재난문자 등을 통해 새벽시간 외출 자제, 위험지역 접근금지 등과 같은 국민행동요령을 집중적으로 홍보할 것을 당부했다. 지역재난안전대책본부에는 총 1만5708명이 비상근무 중이며 재난문자는 123건, 자동음성통보는 138회 등이 발송됐다. 이날 김민재 중앙재난안전대책본부 본부장(행안부 장관 직무대행)은 '집중호우 대처상황 긴급 점검회의'를 주재하고 "정부는 인명 피해를 최소화하기 위해 상황 대응에 만전을 기할 것"이라고 말했다. 특보 및 강수량 분포도/제공=행정안전부 wideopen@newspim.com 2025-07-17 13:39
안다쇼핑
Top으로 이동