전체기사 최신뉴스 GAM 라씨로
KYD 디데이
글로벌 미국·북미

속보

더보기

MS, 경량 AI 언어모델 '파이-3' 시리즈 출시...SLM 경쟁도 본격화

기사입력 : 2024년04월24일 08:40

최종수정 : 2024년04월24일 08:40

[서울=뉴스핌] 최원진 기자= 생성형 인공지능(AI) 챗GPT 개발사 오픈AI와 손잡은 마이크로소프트(MS)가 차세대 소형언어모델(SLM) '파이(Phi)-3' 시리즈 중 초경량 모델인 '파이-3 미니'를 23일(현지시간) 출시했다.

파이-3 미니는 MS가 앞으로 내놓을 '파이-3' 시리즈 모델 중 하나로 매개변수(파라미터)는 38억 개다.

파이-3 미니는 이날 애저 AI 모델 카탈로그, 허깅 페이스, 엔비디아 NIM 등 각종 소프트웨어 플랫폼에 출시됐다.

회사가 앞으로 내놓을 모델인 '파이-3 스몰'은 70억 파라미터, '파이-3 미디움'은 140억 파라미터다. 이들 모델은 애저 AI 모델 카탈로그 등의 플랫폼에 조만간 출시될 예정이다.

마이크로소프트. [사진=로이터 뉴스핌]

MS는 파이-3 시리즈가 시중에 있는 SLM 중 "가장 유능하고 비용 면에서 효율적"이라고 소개했다.

지난해 12월 MS는 전작인 파이-2를 출시한 바 있는데 파이-3는 이전 버전보다 성능이 개선됐을 뿐만 아니라 이보다 10배 큰 모델 수준의 응답도 제공할 수 있다는 설명이다.

MS 애저 AI 플랫폼의 부사장 에릭 보이드 말에 따르면 파이-3 미니의 경우 오픈AI의 LLM '챗-3.5' 성능에 견준다.

SLM은 휴대전화와 노트북 등 개인용 기기에서 작동하는 등 간단한 작업에 적합하도록 설계된 모델이다. 한정된 자원의 조직에서 더 쉽게 접근하고 사용할 수 있으며 특정 요구 사항을 충족하도록 미세 조정이 가능하다.

거대언어모델(LLM)과 달리 SLM은 작업을 위해 클라우드를 거칠 필요가 없고 기계학습 등 비용이 비교적 저렴하다는 장점이 있다.

MS 생성형 AI 연구 담당 부사장인 세바스티엔 부벡은 파이-3 등 소형 모델이 거대 모델 대비 비용이 10분의 1 수준이라고 밝혔다.

소날리 야다브 MS 생성형 AI 수석 제품 매니저는 "우리가 보게 될 것은 거대 모델에서 소형 모델로의 전환이 아니라 단일 모델 범주에서 고객이 자신에게 가장 적합한 모델이 무엇인지 결정할 수 있는 모델 포트폴리오로의 전환"이라고 밝혔다.

루이스 바르가스 MS AI 부문 부사장은 "일부 고객은 소형 모델만 필요로 할 수 있고 일부는 거대 모델만 필요로 할 수 있지만 많은 이들은 두 가지 모두 합쳐 여러 방식으로 활용할 것"이라고 내다봤다.

IT 업계의 AI 경쟁이 LLM뿐만 아니라 SLM에서도 치열해졌다.

지난 2월 구글은 간단한 챗봇 구동과 언어 관련 작업에 특화된 경량 모델 '젬마 2B'와 '7B'를 출시했으며 페이스북 모기업 메타는 지난 18일 '라마 3'를 출시하면서 파라미터 80억 개의 소형 모델도 선보인 바 있다. 

AI 스타트업 앤스로픽은 방대한 양의 연구 논문 등을 빠르게 요약해주는 '클로드(Claude) 3 하이쿠(Haiku)' 모델을 출시했다.

wonjc6@newspim.com

[뉴스핌 베스트 기사]

사진
SKT '유심 교체' 북새통...내 차례 올까 [인천=뉴스핌] 김학선 기자 = 가입자 유심(USIM) 정보를 해킹 당한 SK텔레콤이 유심 무료교체 서비스를 시작한 28일 인천의 한 대리점에서 고객들이 유심 교체를 위해 줄을 서 차례를 기다리고 있다. SKT는 사이버침해 피해를 막기 위해 이날 오전 10시부터 전국 2600여곳의 T월드 매장에서 희망 고객 대상 유심 무료교체 서비스를 진행한다. 2025.04.28 yooksa@newspim.com   2025-04-28 12:12
사진
"화웨이, 엔비디아 H100 능가 칩 개발" [서울=뉴스핌]박공식 기자 = 중국 화웨이가 미국이 수출 금지한 엔비디아 칩을 대체할 최신 인공지능(AI) 칩을 개발해 제품 시험을 앞두고 있다고 월스트리트저널(WSJ)이 현지 시간 27일 보도했다. 신문은 화웨이가 일부 중국 기술기업에 새로 개발한 '어센드(Ascend) 910D'의 시험을 의뢰했다고 전했다. 어센드 910D는 엔비디아의 H100보다 성능이 더 우수한 것으로 평가되고 있으며 이르면 5월 말 시제품이 나올 것으로 예상된다. 앞서 로이터통신은 21일 화웨이가 자체 개발한 AI칩 910C를 내달 초 중국 기업에 대량 출하할 계획이라고 보도한 바 있다. 화웨이를 비롯한 중국 기업들은 데이터를 알고리즘에 제공해 더 정확한 결정을 내리게 하는 훈련 모델용으로 엔비디아 칩에 필적하는 첨단 칩을 개발하는 데 주력해왔다. 미국은 중국의 기술 개발을 억제하기 위해 B200 등 최첨단 엔베디아 칩의 중국 수출을 금지하고 있다. H100의 경우 2022년 제품 출하 전에 중국 수출을 금지했다.  중국 베이징에 있는 화웨이 매장 [서울=뉴스핌]박공식 기자 = 2025.04.28 kongsikpark@newspim.com kongsikpark@newspim.com 2025-04-28 12:26
안다쇼핑
Top으로 이동