서울과기대·테디썸, 라마3-70B 기반 한글 특화 LLM '블라썸' 세계최초 공개

기사입력 : 2024년05월09일 14:21

최종수정 : 2024년05월09일 14:21

라마3 70B 모델에 한국어 확장 첫 사례
업스테이지·솔트룩스·마음AI에 도전장
블라썸, 기본 모델 대비 89% 답변 향상

[세종=뉴스핌] 이경태 기자 = 국내 연구진과 인공지능(AI) 기업이 공동연구를 통해 메타의 오픈소스 거대언어모델(LLM)을 활용한 한국어 어휘 확장 대형 모델을 세계 최초로 개발했다.

이미 오픈소스 기반 LLM 개발 업체인 업스테이지, 솔트룩스, 마음AI에 한발 앞선 기술력으로 도전장을 내민 셈이다.

서울과학기술대학교 다층퍼셉트론(MLP)연구실과 테디썸은 9일 오후께 한국어 최초 70B급 한국어-영어 초거대 언어모델 블라썸(Bllossom)을 완전 공개했다. 이는 현재 가장 좋은 성능으로 평가받는 공개 언어모델인 라마3(LLama3-70B) 기반 모델 중 어휘 확장 모델로는 전세계에서 최초로 꼽힌다.

메타는 지난달 18일(현지 시간) 자체 개발한 오픈소스 거대언어모델(LLM)인 라마(Llama)의 3세대 버전을 무료로 출시했다. 라마 3는 8B 및 70B 매개변수 두 모델로 우선 공개됐다. 라마3은 15조 개의 토큰으로 학습됐다.

이 가운데 70B 모델은 오픈AI가 개발한 GPT-3.5보다 성능이 좋고 GPT4 성능에 근접한 수준이라는 평가를 일부 받는다. 라마3는 한국어에 특화돼 있는 모델로 평가된다.

테디썸이 라마3 70B 모델을 활용해 자체 개발한 한국어 특화 확장 거대언어모델인 '블라썸'을 허깅페이스에 9일 게재했다. 실제 전체 공개는 이날 오후께 진행된다. [사진=테디썸] 2024.05.09 biggerthanseoul@newspim.com

서울과기대와 테디썸은 라마3 70B모델에 추가적인 어휘확장을 했다.

어휘 확장은 특정 언어의 단어를 추가해 심층적인 표현이 가능하도록 하는 방법이다. 70B급 거대 언어모델은 어휘를 확장하면 새로운 어휘의 표현학습을 위해 엄청난 추가 학습시간 및 비용이 소요된다. 이렇다보니 70B급 모델에 어휘확장이 시도된 사례는 한국어에서는 아직 찾아볼 수 없다.

이번 블라썸 모델은 서울과기대 슈퍼컴퓨팅센터의 컴퓨팅 지원을 토대로 대량의 GPU를 활용해 어휘확장 및 영어-한국어 지식 연결 학습이 가능했던 것으로 파악됐다.

임경태 서울과기대 인공지능응용학과 교수 연구팀은 이번 모델 개발을 위해 ▲한국어 표현력 강화를 위한 3만개가 넘는 한국어 어휘 추가 ▲한국어 어휘 표상 학습을 위한 대규모 사전학습 ▲한국어-영어 지식 연결을 위한 Parallel 학습 ▲한국어-영어 지식 표현을 위한 지시미세조정(Instruction Tuning) ▲사용자 피드백(feedback) 기반의 강화학습 등을 진행했다.

방대한 영어 지식을 한국어와 연결시키기 위해 직접 구축한 병렬(Parallel) 데이터 셋을 활용했다는 점과 언어학자들이 직접 구축한 정교한 지시미세조정 데이터가 성능을 크게 향상시켰다는 점이 이번 모델 개발에서 주목할 만한 요소다.

테디썸은 이번에 개발한 모델을 전체 공개해 개별적인 추가 학습과 상업적 이용이 가능하다는 점을 강조했다.

이번 모델은 한국어 토큰 확장으로 인해 25% 확장된 컨텍스트 활용이 가능하다. 인간평가와 GPT4 한국어 답변 선호도 평가 결과 GPT3.5와 유사하거나 약간 앞선 결과를 보인 바 있다. 라마3 70B 기본모델 대비 한국어 답변에 대해 89% 더 높은 답변 선호도 평가를 기록했다.

테디썸은 이미 8B 소형 모델은 전세계 기술 공유 플랫폼인 허깅페이스에 공개됐고 70B 거대모델도 이날 함께 공개했다. 개인 GPU에서 작동 가능한 4bit 양자화된 모델과 직접 활용해볼 수 있는 데모도 함께 내놓는다.

함영균 테디썸 대표는 "기존 빅테크에서만 연구개발하고 공개되지 않던 70B 거대 모델을 중소규모 회사 및 연구 그룹에서도 활용할 수 있도록 초거대 언어모델의 민주화에 기여했다는 점에서 의미있는 첫 발자국이라 생각한다"고 말했다.

한편 국내에서 라마3 소형 모델인 8B를 기반으로 자체 LLM 모델을 개발해 공개한 기업은 솔트룩스, 마음AI 등이다. AI 기업 데이터드리븐의 이준범 수석 AI 연구원도 개인적으로 8B 기반 모델을 공개한 바 있다.

biggerthanseoul@newspim.com

[관련기사]

[관련키워드]

인공지능 LLM GPU 과학기술 테디썸 블라썸 라마3

GAM - 해외주식 투자 도우미

[AI의 종목 이야기] 사이버보안 포티넷, 시간 외 24% 폭등...실적 호조

도어대시 시간 외 17% 급등…주문액 기대치 초과

[홍콩 대장주] 메이퇀 ③ 신성장 동력의 '폭발적 성장'

[홍콩 대장주] 메이퇀② 실적은 고속 상승, 밸류는 역대 저점

[뉴스핌 베스트 기사]

사진

'내란중요임무종사' 한덕수 오늘 항소심 [서울=뉴스핌] 박민경 기자 = 12·3 비상계엄 관련 내란중요임무종사 혐의로 1심에서 징역 23년을 선고받은 한덕수 전 국무총리에 대한 항소심 결론이 오늘 나온다. 서울고법 내란전담재판부인 형사12-1부(재판장 이승철)는 7일 오전 10시 한 전 총리의 내란 중요임무 종사, 허위공문서 작성, 위증 등 혐의 사건의 항소심 선고 공판을 연다. 이번 재판부 판단은 서울고법에 설치된 내란전담재판부의 첫 내란 관련 혐의에 대한 판단이기도 하다. 12·3 비상계엄 관련 내란중요임무종사 혐의로 1심에서 징역 23년을 선고받은 한덕수 전 국무총리에 대한 항소심 결론이 오늘 나온다. 사진은 한 전 총리가 지난 1월 21일 오후 서울 서초구 서울중앙지방법원에서 열린 내란 방조 및 내란 중요임무 종사 혐의 관련 1심 선고 공판에 출석하는 모습. [사진=뉴스핌 DB] 서울고법은 오늘 진행되는 한 전 총리의 내란 중요임무 종사 등 혐의 사건 항소심 선고기일을 생중계하기로 결정했다. 한 전 총리는 국정 2인자인 국무총리로서 대통령의 독단적 권한 행사를 견제해야 할 의무가 있음에도, 윤석열 전 대통령의 위헌·위법한 비상계엄 선포를 막지 않고 방조한 혐의 등을 받는다. 1심 진행 중에 재판부의 요청에 따라 내란 중요임무 종사 혐의가 추가됐다. 앞서 1심은 한 전 총리의 내란 중요임무 종사 혐의를 유죄로 인정하며 특검 구형(징역 15년)보다 높은 징역 23년을 선고했다. 또한 증거인멸 우려를 이유로 그를 법정구속했다. 특검은 2심 결심에서 "피고인은 대통령 탄핵 이후 권한대행 지위에서 국정 안정에 힘쓰기보다 헌법재판관을 미임명해 정치적 혼란을 야기했다"며 "따라서 징역 23년이란 원심의 선고형은 피고인의 죄책에 부합한다. 피고인에게 원심 선고형과 같은 형을 선고해 달라"고 밝혔다. pmk1459@newspim.com 2026-05-07 06:00

사진

삼성전자, 중국 내 가전·TV 판매 중단 [서울=뉴스핌] 김아영 기자 = 삼성전자가 수익성 악화와 시장 경쟁력 저하에 직면한 중국 내 가전 및 TV 사업을 전격 중단한다. 삼성전자는 현지 임직원들에게 판매 종료를 공식 통보하는 한편, 최근 영상디스플레이(VD) 사업부 수장을 교체하는 등 중국 사업을 비롯한 글로벌 가전 비즈니스 전반의 고강도 체질 개선에 나선 모습이다. 6일 가전업계에 따르면, 삼성전자는 이날 중국 현지 임직원을 대상으로 가전 및 TV 제품의 현지 판매 중단을 공식 통보했다. 서울 서초구 삼성전자 서초사옥 [사진 = 뉴스핌DB] 이번 결정은 원자재 가격 상승과 부품비 부담으로 인한 수익성 저하가 주요 원인으로 꼽힌다. TV 사업을 담당하는 VD와 생활가전(DA) 사업부는 지난해 약 2000억 원의 적자를 기록했다. 올해 1분기 2000억원의 영업이익을 내며 반등했지만, 중국 업체의 가파른 점유율 확대 속에 미래 경쟁력을 담보하기 어렵다는 내부 판단이 작용한 것으로 풀이된다. 지난해 삼성전자 중국 판매법인의 당기순이익은 1681억원으로 전년(3700억 원) 대비 44% 급감했다. 이 같은 경영 위기를 타개하기 위해 삼성전자는 인적 쇄신 카드도 꺼내 들었다. 지난 4일 TV 사업 사령탑인 VD 사업부 수장을 용석우 사장에서 이원진 사장으로 전격 교체했다. 앞서 용 사장은 지난달 15일 서울 강남에서 열린 '더 퍼스트룩 서울 2026' 행사에서 중국 내 사업 축소설에 대해 "중국 사업이 어려운 것은 사실"이라며 "여러 가지 형태로 (사업을) 보고 있고 현재 진행 중"이라고 밝힌 바 있다. 결국 용 사장의 발언 한 달 만에 판매 중단과 수장 교체라는 강도 높은 조치가 이뤄진 셈이다. 향후 삼성전자는 중국 시장에서 가전·TV 판매는 멈추되 핵심 생산 거점으로서의 역할은 유지할 방침이다. 현지 냉장고, 세탁기, 에어컨 생산 체계를 지속 가동해 인근 국가로 제품을 공급하는 수출 전진기지로 활용한다. 대신 모바일, 반도체, 의료기기 등 첨단 분야에 역량을 집중한다. 스마트폰 사업은 '심계천하(W시리즈)'와 갤럭시 인공지능(AI)을 앞세워 현지 공략을 강화하고, 우수 AI 업체들과의 협력도 확대한다. 쑤저우와 시안의 반도체 공장 및 기술 연구 시설 역시 변동 없이 운영될 예정이다. 한편, 기존 가전 구매자에 대한 사후 서비스(AS)는 차질 없이 이행된다. 삼성전자는 중국 소비자 보호법 등 관련 규정에 의거해 제품 구매 기간과 결함 정도에 따른 무·유상 서비스를 지속 제공하며 현지 고객의 불편을 최소화할 계획이다. aykim@newspim.com 2026-05-06 20:11