전체기사 최신뉴스 GAM
KYD 디데이
산업 재계·경영

속보

더보기

LG가 만든 AI는 달랐다...오픈AI·메타도 외면한 '이것' 챙긴다

기사입력 : 2025년02월21일 15:19

최종수정 : 2025년02월21일 15:19

초거대 AI 학습 자료, 저작권 등 문제 없을까
오픈AI·메타 등 저작권 문제로 미국서 줄소송
LG가 개발한 '넥서스' 1분 만에 리스크 판단
인간 대비 속도는 45배 빨라지고 비용은 '0'
"글로벌 AI와 경쟁할 수 있는 역량 있다"

[서울=뉴스핌] 서영욱 기자 = #. 지난 2023년 유명 코미디언이자 작가인 세라 실버먼은 챗GPT 개발사 오픈AI와 메타를 상대로 소송을 냈다. 오픈AI와 메타가 대규모 언어 모델(LLM)을 훈련하기 위해 동의 없이 저작권 있는 자료를 사용했다는 주장이다. 메타 최고경영자(CEO) 마크 저커버그는 자체 인공지능(AI) 모델 '라마(LLaMA)'의 학습을 위해 불법 자료 제공 사이트인 'Z-라이브러리'나 '립젠'에서 데이터를 사용할 수 있도록 허가했다는 의혹을 받고 있다.

챗GPT와 딥시크와 같은 대규모 언어 모델(LLM)이 속속 등장하면서 산업계 판도를 바꾸고 있다. LLM은 수십억~수천억개에 달하는 방대한 데이터를 학습, 최대한 인간의 생각과 유사한 답변을 내놓도록 훈련을 받는다. 이 과정에서 저작권과 같은 타인의 권리를 침해하거나 낮은 신뢰도, 또는 비윤리적인 정보까지 받아들이는 등 무분별한 데이터 학습 문제가 조만간 수면위로 부상할 것이란 게 업계 관측이다.

배경훈 LG AI연구원장 [사진=LG]

◆초거대 AI 학습 자료, 저작권 문제 없을까?
21일 관련 업계에 따르면 LG AI연구원은 최근 AI 모델에 사용된 학습 데이터셋이 법적 리스크는 없는지, 또 사전에 이 데이터를 사용하는데 위험 요소는 없는지를 검증할 수 있는 AI 에이전트(AI Agent) '넥서스(NEXUS)'를 공개했다.

수천, 수만개의 데이터소스가 연결된 데이터셋은 수없이 재배포 되면서 사람이 일일이 출처를 추적하는 것이 사실상 불가능하다. 또 재배포되는 각 단계마다 수십 개 혹은 수백 개의 데이터셋들과 연결돼 있기도 하다. 이렇게 복잡하게 연결된 데이터셋의 안전성을 파악하기는 매우 어렵다. 데이터셋의 복잡성은 결국 메타의 사례처럼 심각한 법적 리스크로 연결될 수 있다.

실제로 LG AI연구원이 지난 한 해 동안 잠재적 위험 요소를 식별해 보완한 결과 '저작권 관련 법적 문제', '민감 데이터 사용으로 인한 프라이버시 침해' 등 데이터 관련 내용이 전체 46%로 가장 많았다. LG AI연구원은 '모든 문제는 데이터 문제로부터 시작된다'는 인식 아래 데이터셋의 법적 투명성과 안정성 확보를 중심으로 개선 방안을 고민했다.

LG AI연구원이 공개한 NEXUS [사진=LG AI연구원]

◆LG AI가 1분 만에 리스크 판단, "변호사 선임 비용 줄었네"
LG AI연구원의 '넥서스'는 데이터셋의 복잡한 계층 구조까지 찾아 자동으로 분석한다. AI가 미국, 영국, EU, 한국, 중국을 포함한 다양한 관할권의 저작권법, 판례 및 AI 규제 등을 고려해 리스크를 평가, 각 단계에서 발생할 수 있는 라이선스 충돌, 권리관계 불일치, 개인정보 포함 여부 등을 자동으로 감지한다. 이에 대한 구체적인 리스크 평가 결과를 7개의 위험 등급으로 나눠 제공해준다. 라이선스를 명백히 위반했을 경우 가장 낮은 등급을 부여하는 식이다.

LG AI연구원이 개발한 AI 모델 '엑사원 3.5(EXAONE 3.5)'를 기반으로 한 넥서스는 정확성과 속도 면에서 높은 성과를 달성했다. 자체 검증 결과 인간 대비 45배 이상 빠른 속도로 작업을 완료하면서 비용은 700분의 1 수준으로 절감할 수 있었다. 인간이 하나의 데이터셋에 대해 라이선스 정보를 찾고 이를 종합해 법적 위험을 평가하는 전체 프로세스의 수행 시간은 2400초가 걸린 반면 넥서스는 단 53.1초 만에 끝냈다. 비용도 0.29달러(약 300원 내외)로 변호사와 같은 전문가가 검토하는 것 보다 큰 폭의 비용 절감 효과를 끌어낼 수 있게 됐다.

LG는 넥서스가 대규모로 라이선스 검토가 이뤄져야 하는 산업 현장, 연구 기관, 법무 부서 등에서 신속성과 정확성은 물론 경제성까지 모두 충족시켜줄 수 있을 것으로 기대하고 있다. 궁극적으로 넥서스를 AI 개발자를 위한 법적 리스크 관리 시스템으로 발전시켜 안전하고 책임 있는 AI 생태계 구축에 기여하는 것을 목표로 하고 있다.

LG AI연구원 관계자는 "향후 세상에 존재하는 모든 데이터의 라이프 사이클을 파악할 수 있는 규모로 확대할 계획"이라며 "현재 18개 평가 항목은 AI 모델과 데이터 사용 패턴의 변화를 반영해 지속적으로 고도화하고, 글로벌 AI 커뮤니티 및 법률 전문가와 협력해 국제 표준으로 발전시킬 계획"이라고 말했다.

구광모 LG그룹 회장 [사진=LG]

◆"개발 비용이 딥시크 보다 싸다고?"...LG "글로벌 경쟁력 충분"
넥서스의 기반이 된 '엑사원'을 개발한 LG그룹과 LG AI연구원은 최근 어느 때 보다 바쁜 행보를 보이고 있다. 특히 배경훈 LG AI연구원장이 지난 6일 "엑사원 3.5 모델을 개발하는데 70억원이 들었다"고 밝히면서 주목을 끌었다. 딥시크의 개발비용(약 78억원) 보다 더 낮은 비용이 들었다는 이야기다. 우리나라도 적은 비용으로 딥시크에 뒤지지 않는 AI를 개발할 수 있는 사례로 알려졌다. 정부가 '3대 AI 강국' 도약을 선언한 지난 17일 최상목 대통령 권한대행 부총리 겸 기획재정부 장관 주재 회의에서도 배 원장이 정책 제언에 나서기도 했다.

이 자리에서 배 원장은 "LG AI연구원도 현재 엑사원 추론 강화 모델을 준비하고 있으며 조만간 공개 가능하다"며 "우리나라 AI 기술도 글로벌에서 충분히 경쟁할 수 있는 역량이 있다"고 강조했다. 엑사원 3.5 32B 모델은 최근 미국 에포크(Epoch) AI가 선정한 '주목할 만한 AI(Notable AI Model)'에 등재됐다. 에포크 AI는 과학자들로 구성된 미국의 비영리 AI 연구 기관으로 모델의 성능, 사용 빈도, 학습 비용 등 AI 모델 주요 요소 심사를 통과해야 등재가 가능하다. 우리나라도 외부 전문가들로부터 인정받는 글로벌 수준의 AI 모델을 보유하고 있다는 의미다.

다만 엑사원은 LG그룹 전 계열사에 접목해 신약 개발을 비롯한 신사업 발굴에 초점이 맞춰진 산업분야에 특화된 모델이다. 개인이 자유롭게 사용할 수 챗GPT나 딥시크와는 현재 성격이 다르다. LG AI연구원은 지난해 12월 엑사원 3.5의 오픈소스를 공개하며 AI 연구 생태계를 촉진시키는 역할을 하고 있다. 이는 구광모 LG그룹 회장의 경영이념과도 맞닿아 있다. 구 회장은 올해 신년사에서 "AI와 같은 첨단 기술을 일상에서 편리하게 사용할 수 있게 해 소중한 시간을 보다 즐겁고 의미 있는 일에 쓰는 새로운 라이프 스타일을 만들어 가겠다"고 강조한 바 있다.  

syu@newspim.com

[뉴스핌 베스트 기사]

사진
김영훈 고용부 장관 후보자는 누구? [세종=뉴스핌] 양가희 기자 = 이재명 대통령이 김영훈 전 민주노총 위원장을 고용노동부 장관 후보자로 임명했다. 강훈식 대통령실 비서실장은 23일 11개 부처 장관 후보자를 발표했다. 김 후보자는 1968년 부산에서 태어나 마산중앙고, 동아대를 졸업해 성공회대 NGO대학원에서 정치정책학(정치학) 석사 학위를 받았다. 김영훈 고용노동부 장관 후보자 [사진=대통령실] 2025.06.23 sheep@newspim.com 김 후보자는 2010년부터 2012년까지 민주노총 위원장으로 활동하다가 2017년 정의당에 입당, 제19대 대통령 선거에서 노동본부장을 맡았다. 2021년에는 더불어민주당 대선 후보 이재명 대통령의 노동부문 지지단체 '공정사회 구현을 위한 노동광장'에 공동대표로 참여한 바 있다. 지난 총선에서는 더불어민주연합에서 비례대표 20번을 받았다. 현재 한국철도공사 기관사이자 부산지방노동위원회 공익위원으로 활동하고 있다. 강 비서실장은 "민주노총 위원장을 역임하며 노동의 목소리를 대변해 온 인물"이라며 "산업재해 축소, 노란봉투법 개정, 주4.5일제 등 일하는 사람들의 권리를 강화하는 역할을 해줄 것으로 기대한다"고 밝혔다. 한 정부 관계자는 김 후보자에 대해 "합리적이다"라며 "민주노총이 그간 (사회적 대화 등) 제도권 밖에 있었다. 이를 계기로 제도권으로 들어오길 희망한다"고 말했다. ◇ 김영훈 고용노동부 장관 후보자 프로필 ▲1968년 부산 출생 ▲마산중앙고, 동아대, 성공회대 NGO대학원 정치정책학 석사 ▲정의당 노동본부장 ▲민주노총 위원장 ▲철도노조 위원장 ▲철도공사 기관사 ▲부산지방노동위원회 공익위원 sheep@newspim.com 2025-06-23 14:57
사진
안규백 64년 만에 문민 국방 후보자 [서울=뉴스핌] 김종원 국방안보전문기자 = 국군 최고통수권자인 이재명 대통령은 23일 초대 국방부 장관에 민간인 출신인 안규백(64) 더불어민주당 5선 중진 의원을 인선했다. 강훈식 대통령실 비서실장은 이날 "안 후보자가 국회 국방위원회 간사와 위원장 등 5선 국회의원 이력의 대부분을 국회 국방위에서 활동했다"면서 "군에 대한 이해도가 풍부하고 64년 만에 문민 국방장관으로서 계엄에 동원된 군의 변화를 책임지고 이끌어 나갈 것"이라고 인선 배경을 설명했다.  안규백 국방부 장관 후보자. [사진=대통령실] 안 후보자는 집권 여당인 민주당에서 국방위원장을 비롯해 국방위원으로서 15년 간 의정활동을 했다. 그 누구보다 군과 국방안보를 잘 아는 인물로 그동안 역대 정부에서도 꾸준히 민간인 출신 국방장관으로 유력하게 거명됐었다. 특히 안 후보자는 국회 12·3 비상계엄 사태에 대한 진상규명 국정조사 특위위원장 중책까지 맡았다. 여야 의원들을 아우르며 적지 않은 성과를 냈다는 평가다. 이번 대선에서도 민주당 중앙선대위 총괄특보단장 핵심 보직을 맡았다. 계엄 사태 주역인 군의 정치적 중립성을 확립하면서 어수선한 군을 안정적으로 이끌면서 군 전반을 개혁할 최적임자로 꼽힌다. 합리적인 성품에 남의 말을 귀담아듣는 전형적인 외유내강형 인물이다. 다만 상식과 원칙을 중시하며 불법적이고 정의롭지 않은 일에는 불같이 화를 내는 성격이다. 아들 둘 모두 육군과 해병대에서 현역으로 군 복무를 했다.  안 후보자가 국회 인사청문회를 통과해 이재명정부의 초대 국방장관으로 취임하면 1961년 현석호 장관 이후 64년 만에 군인이 아닌 민간인 출신 국방장관이 된다.  한국 정치사의 격동기를 거쳐 군사독재정권 시절에 장군 출신들이 독식했던 국방장관을 정치 안정기에 들어 사실상 민간인 출신의 진정한 '문민 국방장관'이 나올 수 있을지 초미 관심사다. ▲전북 고창(64) ▲광주 서석고 ▲성균관대 철학과 학사·무역대학원 무역학 석사 수료 ▲18·19·20·21·22대 국회의원 ▲국회 국방위원회 위원장·간사 ▲국회 '내란 진상규명 국정조사 특별위원회' 위원장 ▲더불어민주당 사무총장 kjw8619@newspim.com 2025-06-23 14:13
안다쇼핑
Top으로 이동