[서울=뉴스핌] 양태훈 기자 = 네이버클라우드는 지난 3일, 초대규모 AI '하이퍼클로바X'의 테크니컬 리포트를 공개했다고 4일 밝혔다. 테크니컬 리포트는 학습 방법이나 성능 등 AI 모델의 세부 정보를 소개하는 논문이다.
네이버클라우드 측은 "하이퍼클로바X는 성능 평가에서 글로벌 오픈소스 모델보다 높은 종합 점수를 획득했으며, 특히 한국어, 일반상식, 수학, 코딩 부문에서는 비교 대상 14개 모델 중 1위를 기록했다"며, "폐쇄형 모델과 비교해서도 한국어 능력은 1위, 영어 능력은 2위에 올랐다. 이는 특정 국가 언어뿐 아니라 다양한 분야의 문제 해결력을 갖춘 소버린 AI로서의 경쟁력을 보여준 것"이라고 강조했다.
또한 "하이퍼클로바X는 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력도 갖췄다"며, "일본어, 아랍어, 힌디어, 베트남어를 비롯한 아시아 국가 언어 능력을 평가했을 때, 하이퍼클로바X는 주요 오픈소스 모델을 포함해 리포트에서 선정한 9개 모델 중 가장 높은 점수를 획득했다"고 전했다.
'하이퍼클로바X' 로고. [사진=네이버] |
나아가 "기계 번역 평가에서도 하이퍼클로바X의 다국어 능력이 입증됐으며, 한국어를 일본어로, 일본어를 한국어로 번역하는 능력은 실제 서비스 중인 번역 모델 등 리포트에서 선정한 10개의 모델 중 1위를 기록했다"며, "영어를 한국어로 번역하는 정확도도 동일한 10개 모델 중 가장 높은 점수를 기록했다"고 덧붙였다.
네이버클라우드는 윤리 원칙에 기반해 혐오, 편향, 저작권 침해, 개인정보 등의 콘텐츠를 생성하지 않도록 개선하고, 기술 또는 서비스의 취약점을 발견하고 검증하기 위해 의도적으로 공격을 시도하는 활동인 레드티밍을 통해 모델의 취약점도 보완하는 등 하이퍼클로바X의 안전성을 위한 노력도 테크니컬 리포트를 통해 소개했다.
성낙호 네이버클라우드 기술 총괄은 "한국 특화 지식뿐 아니라 프로그래밍, 수학적 추론, 다국어 능력, 안전성까지 확보한 소버린 AI의 모범 사례"라며, "하이퍼클로바X 구축 경험을 바탕으로 다양한 국가의 특화 초대규모 AI 개발에도 적극 나설 것"이라고 강조했다.
한편, 네이버클라우드는 한국어, 영어, 수학, 코딩, 상식, 사실성, 안전성 등 여러 분야에서 하이퍼클로바X 및 비교군 모델들의 성능 평가를 진행했다. 각 분야의 성능 측정에는 신뢰성 있는 평가 체계들을 인용하거나 자체 개발한 평가 지표를 활용했다.
dconnect@newspim.com