하민회 (이미지21대표, 미래기술문화연구원장)
중국산 파란고래가 전 세계를 흔들고 있다. 지난 20일 출시한 딥시크 (Deep Seek).
모델 훈련 비용 557만6000달러(약 80억원), 오픈AI의 GPT-4 개발 추정 비용의 18분의 1, 메타의 라마3 개발 비용의 10분의 1에 불과하다. 훈련에 사용된 GPU는 저 사양 ''H800'. 2022년 미국의 수출 규제로 H100의 중국 수출이 금지되면서 사양을 낮춰 중국 본토용으로 출시한 버전이다.
18분의 1의 비용으로 챗GPT o1에 필적할 만한 성능이라니. 중국산 AI의 미친 가성비는 미국 증시에 직격탄이 되었다. 딥시크 출시 7일만에 엔비디아 주가는 17% 급락, 하루 만에 시가총액 약 6000억 달러(약 840조 원)가 증발했다.
실리콘밸리의 유명 투자자 마크 앤드리슨(Marc Andreessen)은 X에 딥시크의 등장을 "AI의 스푸트니크 순간 (Sputnik Moment)"이라 평가했다. 1957년 소련이 세계 최초로 인공위성 스푸트니크 1호를 발사했을 때, 미국이 우주 경쟁에서 밀리고 있다는 위기감으로 대대적인 국가적 대응을 시작했던 것처럼 중국과의 좁아진 AI 기술 격차를 경계해야 한다는 것이다.
하민회 이미지21 대표. |
뉴욕타임스(NYT)도 "실리콘밸리의 가장 어두운 시간(darkest hour)"이라는 표현으로 미국 AI 기술의 지배적 우위에 대해 강한 회의감을 드러냈다.
딥시크는 어떻게 미국의 칩 수출 제한에도 불구하고 고성능의 AI를 만들 수 있었을까?
딥시크가 스스로 설명하는 저비용 혁신의 비결은 5가지다.
첫째, 전문가 조합 (MoE, Mixture of Experts) 아키텍처. 딥시크는 AI에 복잡한 작업을 더 작은 작업으로 분해한 뒤 각 전문가에 할당하는 전문가 조합(MoE, Mixture of Experts) 모델을 적용했다. 예컨대 한 사람이 모든 책을 다 읽고 나서 답변해 주는 게 아니라, 학교에서 과목별 전문 교사들이 필요한 부분만 정리해 알려주는 교육 방식과 같다. 딥시크는 이 방식으로 6710억개 매개변수 중 약 340억개만 활성화함으로써 비용과 시간 모두를 크게 절약했다.
둘째, 8비트 부동소수점 연산 방식. 딥시크는 일반적으로 숫자를 32개의 0 또는 1, 즉 32비트의 부동소수점으로 연산하는 방식을 8비트로 확 줄여 메모리 사용량을 FP32(32비트) 대비 약 75% 절감한다. 또 저수준 어셈블리 코드를 활용하여 저 사양 GPU에서의 성능을 극대화했다.
[서울=뉴스핌] 최헌규 중국전문기자= 2025.02.01 chk@newspim.com |
셋째, 오픈소스. 딥시크는 이미 공개된 AI 관련 소스코드 등을 바탕으로 개발됐다. 마치 기존 요리 레시피를 참고해 새 요리를 만드는 것과 비슷하다. 누구나 소스 코드를 수정하고 배포할 수 있는 만큼 수많은 개발 인력과 비용을 들여 AI 구동에 필요한 모든 코드를 개발할 필요가 없고 이미 검증된 코드를 가져다 사용하기 때문에 짧은 기간에 고성능 AI를 내놓을 수 있었다.
넷째. 연구 생태계 혁신. 클라우드 의존도를 줄이고 스마트폰과 노트북에서도 고성능 AI를 실행할 수 있는 기반을 마련함으로써 대학 등 소규모 연구진이 고 사양 인프라 없이도 AI 실험을 진행할 수 있는 환경을 제공했다.
다섯째. 중국의 저렴한 인건비 및 정부의 지원금 혜택.
한 가지는 확실하다. '제한이 혁신을 낳은' 딥시크는 AI기술의 승부점을 변화시켰다. 보다 더 높은 성능보다 누가 더 적은 비용으로 고성능을 구현할 것인가 하는 '저비용 혁신'으로 말이다.
등장이 드라마틱했던 만큼 딥시크에 대한 논란도 끊이지 않고 있다.
딥시크의 성능과 가성비에 대한 시장 반응이 지나치게 부풀려졌다는 지적부터 딥시크의 훈련비용은 실제론 훨씬 더 많을 것이다, 중국 수출이 금지된 엔비디아의 고사양 AI 반도체를 다량 보유했을 가능성이 크다, 오픈AI의 저작권을 침해했을 수 있다는 등의 다양한 의심과 비판을 받고 있다.
현실적으로 가장 우려되는 건 중국 정부에 데이터가 유출될 가능성이다. 딥시크는 개인정보 보호 약관에서 중국 내 서버에 데이터를 수집하고 저장한다고 명시하고 있고, 이와 관련한 분쟁은 중국 정부 법률의 적용을 받는다고 밝혔다. 블룸버그에 의하면 딥시크는 AI 모델 학습을 위해 이용자들이 입력한 키보드 패턴이나 텍스트, 오디오, 파일, 피드백, 채팅 기록과 다른 콘텐츠를 수집하고 회사 재량에 따라 해당 정보를 법 집행기관 및 공공 기관과 공유할 수 있다.
세계 각국도 대응에 나섰다. 이탈리아는 딥시크에 20일 이내에 데이터 수집 및 처리 방식에 대한 명확한 설명을 요구하며 조사결과가 나올 때까지 서비스를 차단했다. 미국은 나사(NASA)와 해군에서 사용을 금지했고 의회와 법무부에서 딥시크의 데이터 수집 방식과 국가 안보 위협 가능성을 조사 중이다. 대만 정부는 모든 공공 부문 및 주요 인프라 시설에서 딥시크의 사용을 금지했고 아일랜드, 벨기에, 영국, 프랑스 등 유럽주요국들 역시 국가 안보관점에서 딥시크 서비스 제공방식을 검토 중이다. 우리나라도 개인정보보호위원회(PIPC)에서 딥시크의 사용자 데이터 수집 처리에 관해 조사 중이다.
딥시크는 저비용 고성능 AI 모델로 주목받고 있지만 중국기업인 만큼 데이터 프라이버시와 국가 안보 문제로 인해 세계 각국의 강력한 규제를 받을 것으로 예상된다. 이는 기술적인 문제를 넘어 지정학적 요인도 작용한다.
딥시크 쇼크는 미국과 중국의 압도적인 AI양강 구도에서 기술력 6~7위로 점점 격차가 벌어지고 있는 한국 입장에서는 저비용 고효율 AI 개발 패러다임으로 전환할 절호의 기회다. 한국 AI산업의 현 주소를 냉정한 시각으로 진단해 거듭 날 수 있는 보완책을 마련해야 한다.
무엇보다 국가 주도의 R&D가 필요하다. 대규모 투자와 함께 반도체-AI 민관 융합 클러스트를 구축하고 초경량 고효율 모델 연구에 나서야 한다.
AI 전문가 중국 41만 명, 미국 20만 명에 비해 한국은 2만 명에 불과하다. 인재의 해외유출 방지체계도 미흡한 상황에서 무엇보다 인재양성 시스템의 개편이 시급하다. 초 중등 교육과정에 AI 기초 교육을 필수화하고 대학에 AI 융합학과 신설하고 산학협력 프로그램 확대해 저변을 넓힐 필요가 있다.
데이터 인프라 구축에도 관심을 기울여야 한다. 공공기관 데이터를 체계적으로 수집·가공해 AI 학습용 데이터셋을 구축하고 개인정보보호법을 유연하게 조정해 AI 학습 데이터로 활용할 수 있도록 AI규제 프레임워크를 정비하는 일도 고려해야 한다.
딥시크 쇼크의 진정한 의미는 혁신이 패권에 도전해 글로벌 패러다임을 바꿔 놓았다는 점이다. 제한이 혁신을 낳는다면 한국 역시 누구보다 잘 해 낼 수 있지 않겠는가? 국가가 제 역할을 해내지 못하는 작금의 혼란스러운 상황이 안타까울 뿐이다.
◇하민회 이미지21대표(미래기술문화연구원장) =△경영 컨설턴트, AI전략전문가△ ㈜이미지21대표 △경영학 박사 (HRD)△서울과학종합대학원 인공지능전략 석사△핀란드 ALTO 대학 MBA △상명대예술경영대학원 비주얼 저널리즘 석사 △한국외대 및 교육대학원 졸업 △경제지 및 전문지 칼럼니스트 △SERI CEO 이미지리더십 패널 △KBS, TBS, OBS, CBS 등 방송 패널 △YouTube <책사이> 진행 중 △저서: 쏘셜력 날개를 달다 (2016), 위미니지먼트로 경쟁하라(2008), 이미지리더십(2005), 포토에세이 바라나시 (2007) 등