전체기사 최신뉴스 GAM
KYD 디데이
산업 재계·경영

속보

더보기

LG가 만든 AI는 달랐다...오픈AI·메타도 외면한 '이것' 챙긴다

기사입력 : 2025년02월21일 15:19

최종수정 : 2025년02월21일 15:19

초거대 AI 학습 자료, 저작권 등 문제 없을까
오픈AI·메타 등 저작권 문제로 미국서 줄소송
LG가 개발한 '넥서스' 1분 만에 리스크 판단
인간 대비 속도는 45배 빨라지고 비용은 '0'
"글로벌 AI와 경쟁할 수 있는 역량 있다"

[서울=뉴스핌] 서영욱 기자 = #. 지난 2023년 유명 코미디언이자 작가인 세라 실버먼은 챗GPT 개발사 오픈AI와 메타를 상대로 소송을 냈다. 오픈AI와 메타가 대규모 언어 모델(LLM)을 훈련하기 위해 동의 없이 저작권 있는 자료를 사용했다는 주장이다. 메타 최고경영자(CEO) 마크 저커버그는 자체 인공지능(AI) 모델 '라마(LLaMA)'의 학습을 위해 불법 자료 제공 사이트인 'Z-라이브러리'나 '립젠'에서 데이터를 사용할 수 있도록 허가했다는 의혹을 받고 있다.

챗GPT와 딥시크와 같은 대규모 언어 모델(LLM)이 속속 등장하면서 산업계 판도를 바꾸고 있다. LLM은 수십억~수천억개에 달하는 방대한 데이터를 학습, 최대한 인간의 생각과 유사한 답변을 내놓도록 훈련을 받는다. 이 과정에서 저작권과 같은 타인의 권리를 침해하거나 낮은 신뢰도, 또는 비윤리적인 정보까지 받아들이는 등 무분별한 데이터 학습 문제가 조만간 수면위로 부상할 것이란 게 업계 관측이다.

배경훈 LG AI연구원장 [사진=LG]

◆초거대 AI 학습 자료, 저작권 문제 없을까?
21일 관련 업계에 따르면 LG AI연구원은 최근 AI 모델에 사용된 학습 데이터셋이 법적 리스크는 없는지, 또 사전에 이 데이터를 사용하는데 위험 요소는 없는지를 검증할 수 있는 AI 에이전트(AI Agent) '넥서스(NEXUS)'를 공개했다.

수천, 수만개의 데이터소스가 연결된 데이터셋은 수없이 재배포 되면서 사람이 일일이 출처를 추적하는 것이 사실상 불가능하다. 또 재배포되는 각 단계마다 수십 개 혹은 수백 개의 데이터셋들과 연결돼 있기도 하다. 이렇게 복잡하게 연결된 데이터셋의 안전성을 파악하기는 매우 어렵다. 데이터셋의 복잡성은 결국 메타의 사례처럼 심각한 법적 리스크로 연결될 수 있다.

실제로 LG AI연구원이 지난 한 해 동안 잠재적 위험 요소를 식별해 보완한 결과 '저작권 관련 법적 문제', '민감 데이터 사용으로 인한 프라이버시 침해' 등 데이터 관련 내용이 전체 46%로 가장 많았다. LG AI연구원은 '모든 문제는 데이터 문제로부터 시작된다'는 인식 아래 데이터셋의 법적 투명성과 안정성 확보를 중심으로 개선 방안을 고민했다.

LG AI연구원이 공개한 NEXUS [사진=LG AI연구원]

◆LG AI가 1분 만에 리스크 판단, "변호사 선임 비용 줄었네"
LG AI연구원의 '넥서스'는 데이터셋의 복잡한 계층 구조까지 찾아 자동으로 분석한다. AI가 미국, 영국, EU, 한국, 중국을 포함한 다양한 관할권의 저작권법, 판례 및 AI 규제 등을 고려해 리스크를 평가, 각 단계에서 발생할 수 있는 라이선스 충돌, 권리관계 불일치, 개인정보 포함 여부 등을 자동으로 감지한다. 이에 대한 구체적인 리스크 평가 결과를 7개의 위험 등급으로 나눠 제공해준다. 라이선스를 명백히 위반했을 경우 가장 낮은 등급을 부여하는 식이다.

LG AI연구원이 개발한 AI 모델 '엑사원 3.5(EXAONE 3.5)'를 기반으로 한 넥서스는 정확성과 속도 면에서 높은 성과를 달성했다. 자체 검증 결과 인간 대비 45배 이상 빠른 속도로 작업을 완료하면서 비용은 700분의 1 수준으로 절감할 수 있었다. 인간이 하나의 데이터셋에 대해 라이선스 정보를 찾고 이를 종합해 법적 위험을 평가하는 전체 프로세스의 수행 시간은 2400초가 걸린 반면 넥서스는 단 53.1초 만에 끝냈다. 비용도 0.29달러(약 300원 내외)로 변호사와 같은 전문가가 검토하는 것 보다 큰 폭의 비용 절감 효과를 끌어낼 수 있게 됐다.

LG는 넥서스가 대규모로 라이선스 검토가 이뤄져야 하는 산업 현장, 연구 기관, 법무 부서 등에서 신속성과 정확성은 물론 경제성까지 모두 충족시켜줄 수 있을 것으로 기대하고 있다. 궁극적으로 넥서스를 AI 개발자를 위한 법적 리스크 관리 시스템으로 발전시켜 안전하고 책임 있는 AI 생태계 구축에 기여하는 것을 목표로 하고 있다.

LG AI연구원 관계자는 "향후 세상에 존재하는 모든 데이터의 라이프 사이클을 파악할 수 있는 규모로 확대할 계획"이라며 "현재 18개 평가 항목은 AI 모델과 데이터 사용 패턴의 변화를 반영해 지속적으로 고도화하고, 글로벌 AI 커뮤니티 및 법률 전문가와 협력해 국제 표준으로 발전시킬 계획"이라고 말했다.

구광모 LG그룹 회장 [사진=LG]

◆"개발 비용이 딥시크 보다 싸다고?"...LG "글로벌 경쟁력 충분"
넥서스의 기반이 된 '엑사원'을 개발한 LG그룹과 LG AI연구원은 최근 어느 때 보다 바쁜 행보를 보이고 있다. 특히 배경훈 LG AI연구원장이 지난 6일 "엑사원 3.5 모델을 개발하는데 70억원이 들었다"고 밝히면서 주목을 끌었다. 딥시크의 개발비용(약 78억원) 보다 더 낮은 비용이 들었다는 이야기다. 우리나라도 적은 비용으로 딥시크에 뒤지지 않는 AI를 개발할 수 있는 사례로 알려졌다. 정부가 '3대 AI 강국' 도약을 선언한 지난 17일 최상목 대통령 권한대행 부총리 겸 기획재정부 장관 주재 회의에서도 배 원장이 정책 제언에 나서기도 했다.

이 자리에서 배 원장은 "LG AI연구원도 현재 엑사원 추론 강화 모델을 준비하고 있으며 조만간 공개 가능하다"며 "우리나라 AI 기술도 글로벌에서 충분히 경쟁할 수 있는 역량이 있다"고 강조했다. 엑사원 3.5 32B 모델은 최근 미국 에포크(Epoch) AI가 선정한 '주목할 만한 AI(Notable AI Model)'에 등재됐다. 에포크 AI는 과학자들로 구성된 미국의 비영리 AI 연구 기관으로 모델의 성능, 사용 빈도, 학습 비용 등 AI 모델 주요 요소 심사를 통과해야 등재가 가능하다. 우리나라도 외부 전문가들로부터 인정받는 글로벌 수준의 AI 모델을 보유하고 있다는 의미다.

다만 엑사원은 LG그룹 전 계열사에 접목해 신약 개발을 비롯한 신사업 발굴에 초점이 맞춰진 산업분야에 특화된 모델이다. 개인이 자유롭게 사용할 수 챗GPT나 딥시크와는 현재 성격이 다르다. LG AI연구원은 지난해 12월 엑사원 3.5의 오픈소스를 공개하며 AI 연구 생태계를 촉진시키는 역할을 하고 있다. 이는 구광모 LG그룹 회장의 경영이념과도 맞닿아 있다. 구 회장은 올해 신년사에서 "AI와 같은 첨단 기술을 일상에서 편리하게 사용할 수 있게 해 소중한 시간을 보다 즐겁고 의미 있는 일에 쓰는 새로운 라이프 스타일을 만들어 가겠다"고 강조한 바 있다.  

syu@newspim.com

[뉴스핌 베스트 기사]

사진
남편 신분증으로 대리투표자 구속 [서울=뉴스핌] 이성화 기자 = 제21대 대통령 선거 사전투표 첫날 배우자 신분증으로 대리투표를 한 선거사무원이 구속됐다. 서울중앙지법 염혜수 판사는 1일 공직선거법 위반 혐의를 받는 60대 여성 A씨에 대한 구속 전 피의자 심문(영장실질심사)을 진행한 뒤 "증거 인멸과 도망할 염려가 있다"며 구속영장을 발부했다. 제21대 대통령 선거 사전투표 첫날 배우자 신분증으로 대리 투표를 한 혐의를 받는 60대 선거사무원이 1일 구속됐다. 사진은 지난 5월 29일 한 유권자가 사전투표하는 모습. [사진=뉴스핌DB] A씨는 대선 사전투표 첫날인 지난달 29일 서울 강남구 대치2동 한 사전투표소에서 남편의 신분증으로 투표용지를 발급받아 대리 투표를 한 혐의를 받는다. 그는 약 5시간 뒤 자신의 신분증으로 다시 투표했는데 동일인이 두 번 투표하는 모습을 본 참관인의 신고로 경찰에 긴급체포됐다. 강남구 보건소 소속 계약직 공무원이던 A씨는 이번 대선에서 투표사무원으로 위촉돼 유권자에게 투표용지를 발급하는 업무를 담당한 것으로 알려졌다. 공직선거법 제248조는 성명을 사칭하거나 신분 증명서를 위조·변조해 사용하거나 기타 사위의 방법으로 투표하거나 하게 하거나 투표를 하려고 한 자는 5년 이하의 징역 또는 1000만 원 이하의 벌금에 처하도록 규정한다. 특히 선거사무에 관계있는 공무원이 사위투표 행위를 하거나 하게 한 때에는 7년 이하의 징역에 처하도록 하고 있다. 중앙선거관리위원회는 A씨를 공직선거법상 사위투표 혐의로 고발하고 사전투표 절차를 방해할 목적으로 배우자와 공모했는지 확인하기 위해 A씨 배우자에 대해서도 수사를 의뢰했다. 수서경찰서는 지난달 30일 A씨에 대한 구속영장을 신청했다. A씨는 이날 오후 1시30분께 법원에 출석하며 '대리 투표가 불법인 것을 몰랐냐'는 취재진의 질문에 "전혀 몰랐다. 순간 잘못된 선택을 했다"고 답했다. shl22@newspim.com 2025-06-01 19:37
사진
극우단체 댓글 여론 조작 의혹 [서울·청주=뉴스핌] 한태희 지혜진 기자 = 극우 단체가 댓글 조작팀을 만들어 여론을 조작했다는 의혹이 불거지자 이재명 더불어민주당 대통령 후보는 "반란 행위"라고 규정하며 국민의힘과의 연관성도 거론했다. 국민의힘은 댓글 조작팀은 김문수 대통령 후보뿐 아니라 당과 관련이 없다고 부인했다. [평택=뉴스핌] 김학선 기자 = 이재명 더불어민주당 대선 후보가 31일 경기도 평택시 배다리 생태공원 앞에서 선거 유세를 하고 있다. 2025.05.31 yooksa@newspim.com 이재명 후보는 31일 경기 평택 배다리 생태공원에서 선거 유세에서 "국민 여론을 조작하려는 것은 사실상 반란행위"라고 강하게 비판했다. 이재명 후보는 이어 "댓글을 조작하고 가짜뉴스를 쓰는 행위를 용서할 수 있나"라며 "마지막 잔뿌리까지 다 찾아내 엄중히 책임을 물어야 한다"고 강조했다. 이재명 후보는 댓글 조작팀이 국민의힘과 연관돼 있을 수 있다는 의혹을 제기했다. 이재명 후보는 "더 심각한 것은 국민의힘 관련성이 높다는 것으로 국회의원이 그 단체를 오갔다는 말도 있고 가짜 기자회견을 함께 했다는 이야기도 있다"며 "나라 뒤집어질 중범죄 행위가 나올 것 같다"고 말했다. 민주당도 거들었다. 조승래 민주당 수석대변인은 이날 충북 청주 오창프라자 앞 광장에서 긴급 브리핑을 통해 "김문수 후보와 국민의힘은 저열한 여론조작에 어디까지 가담했는지 실토하라"고 말했다. 조승래 수석대변인은 "12·3 쿠데타의 실패에도 또다시 대한민국을 집어삼키려는 극우 내란 카르텔의 여론조작을 규탄한다"면서 "김 후보와 국민의힘은 여론 조작 공작에 어디까지 가담했는지 밝혀야 하며 보도에 거명된 권성동 원내대표, 김상훈 정책위의장, 조정훈 의원은 직접 해명해야 할 것"이라고 덧붙였다. [강릉=뉴스핌] 최지환 기자 = 김문수 국민의힘 대선후보가 31일 오후 강원 강릉시 중앙시장 앞에서 열린 집중유세 현장에서 이재명 후보와 부인 김혜경 여사의 법인카드 유용 의혹을 비판하는 퍼포먼스를 하고 있다. 2025.05.31 choipix16@newspim.com 국민의힘은 반박문을 내고 일방적인 주장이라고 맞섰다. 국민의힘 중앙선대 미디어법률단은 "국민의힘과 김문수 후보는 '리박스쿨'이나 '자손군'과 아무런 관련이 없다"며 "민주당이 드루킹 댓글조작단을 운영했던 경험을 바탕으로 허위 사실로 해당 단체들과 국민의힘을 억지로 연관시키고 있는데 무리한 시도"라고 비판했다. 이어 미디어법률단은 "뉴스타파와 민주당 주장을 일방적으로 받아쓴 보도가 쏟아지고 있다"며 "유권자 민심을 왜곡할 수 있는 불공정 보도, 허위보도에 대해서는 엄중하게 법적 조치를 취하겠다"고 강조했다. 한편 온라인매체 뉴스타파는 전날 '리박스쿨'이라는 보수단체가 '댓글로 나라를 구하는 자유손가락 군대(자손군)'를 만들어 이재명·이준석 후보를 비방하고 김문수 후보를 추켜세우는 댓글을 올리고 댓글을 올린 사람에게 초등학교 늘봄학교 강사 자격증을 발급하는 여론 조작에 나섰다고 보도했다.  ace@newspim.com 2025-05-31 17:07
안다쇼핑
Top으로 이동