전체기사 최신뉴스 GAM
KYD 디데이
경제 과학기술

속보

더보기

서울과기대·테디썸, 라마3-70B 기반 한글 특화 LLM '블라썸' 세계최초 공개

기사입력 : 2024년05월09일 14:21

최종수정 : 2024년05월09일 14:21

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

라마3 70B 모델에 한국어 확장 첫 사례
업스테이지·솔트룩스·마음AI에 도전장
블라썸, 기본 모델 대비 89% 답변 향상

[세종=뉴스핌] 이경태 기자 = 국내 연구진과 인공지능(AI) 기업이 공동연구를 통해 메타의 오픈소스 거대언어모델(LLM)을 활용한 한국어 어휘 확장 대형 모델을 세계 최초로 개발했다. 

이미 오픈소스 기반 LLM 개발 업체인 업스테이지, 솔트룩스, 마음AI에 한발 앞선 기술력으로 도전장을 내민 셈이다.

서울과학기술대학교 다층퍼셉트론(MLP)연구실과 테디썸은 9일 오후께 한국어 최초 70B급 한국어-영어 초거대 언어모델 블라썸(Bllossom)을 완전 공개했다. 이는 현재 가장 좋은 성능으로 평가받는 공개 언어모델인 라마3(LLama3-70B) 기반 모델 중 어휘 확장 모델로는 전세계에서 최초로 꼽힌다.

메타는 지난달 18일(현지 시간) 자체 개발한 오픈소스 거대언어모델(LLM)인 라마(Llama)의 3세대 버전을 무료로 출시했다. 라마 3는 8B 및 70B 매개변수 두 모델로 우선 공개됐다. 라마3은 15조 개의 토큰으로 학습됐다. 

이 가운데 70B 모델은 오픈AI가 개발한 GPT-3.5보다 성능이 좋고 GPT4 성능에 근접한 수준이라는 평가를 일부 받는다. 라마3는 한국어에 특화돼 있는 모델로 평가된다.

테디썸이 라마3 70B 모델을 활용해 자체 개발한 한국어 특화 확장 거대언어모델인 '블라썸'을 허깅페이스에 9일 게재했다. 실제 전체 공개는 이날 오후께 진행된다. [사진=테디썸] 2024.05.09 biggerthanseoul@newspim.com

서울과기대와 테디썸은 라마3 70B모델에 추가적인 어휘확장을 했다.

어휘 확장은 특정 언어의 단어를 추가해 심층적인 표현이 가능하도록 하는 방법이다. 70B급 거대 언어모델은 어휘를 확장하면 새로운 어휘의 표현학습을 위해 엄청난 추가 학습시간 및 비용이 소요된다. 이렇다보니 70B급 모델에 어휘확장이 시도된 사례는 한국어에서는 아직 찾아볼 수 없다. 

이번 블라썸 모델은 서울과기대 슈퍼컴퓨팅센터의 컴퓨팅 지원을 토대로 대량의 GPU를 활용해 어휘확장 및 영어-한국어 지식 연결 학습이 가능했던 것으로 파악됐다.

임경태 서울과기대 인공지능응용학과 교수 연구팀은 이번 모델 개발을 위해 ▲한국어 표현력 강화를 위한 3만개가 넘는 한국어 어휘 추가 ▲한국어 어휘 표상 학습을 위한 대규모 사전학습 ▲한국어-영어 지식 연결을 위한 Parallel 학습 ▲한국어-영어 지식 표현을 위한 지시미세조정(Instruction Tuning) ▲사용자 피드백(feedback) 기반의 강화학습 등을 진행했다.

방대한 영어 지식을 한국어와 연결시키기 위해 직접 구축한 병렬(Parallel) 데이터 셋을 활용했다는 점과 언어학자들이 직접 구축한 정교한 지시미세조정 데이터가 성능을 크게 향상시켰다는 점이 이번 모델 개발에서 주목할 만한 요소다.

테디썸은 이번에 개발한 모델을 전체 공개해 개별적인 추가 학습과 상업적 이용이 가능하다는 점을 강조했다.

이번 모델은 한국어 토큰 확장으로 인해 25% 확장된 컨텍스트 활용이 가능하다. 인간평가와 GPT4 한국어 답변 선호도 평가 결과 GPT3.5와 유사하거나 약간 앞선 결과를 보인 바 있다. 라마3 70B 기본모델 대비 한국어 답변에 대해 89% 더 높은 답변 선호도 평가를 기록했다.

테디썸은 이미 8B 소형 모델은 전세계 기술 공유 플랫폼인 허깅페이스에 공개됐고 70B 거대모델도 이날 함께 공개했다. 개인 GPU에서 작동 가능한 4bit 양자화된 모델과 직접 활용해볼 수 있는 데모도 함께 내놓는다.

함영균 테디썸 대표는 "기존 빅테크에서만 연구개발하고 공개되지 않던 70B 거대 모델을 중소규모 회사 및 연구 그룹에서도 활용할 수 있도록 초거대 언어모델의 민주화에 기여했다는 점에서 의미있는 첫 발자국이라 생각한다"고 말했다.

한편 국내에서 라마3 소형 모델인 8B를 기반으로 자체 LLM 모델을 개발해 공개한 기업은 솔트룩스, 마음AI 등이다. AI 기업 데이터드리븐의 이준범 수석 AI 연구원도 개인적으로 8B 기반 모델을 공개한 바 있다.

biggerthanseoul@newspim.com

[뉴스핌 베스트 기사]

사진
[변상문의 화랑담배] "국내 진공작전을 서둘러라" 변상문의 '화랑담배'는 6·25전쟁 이야기이다. 6·25전쟁 때 희생된 모든 분에게 감사드리고, 그 위대한 희생을 기리기 위해 제목을 '화랑담배'로 정했다. 이런 상황에서 임시정부 주석 김구는, '선열의 피로써 세우고, 애국지사들이 생명을 걸고 수호한 대한민국 임시정부를 3천만 국민에게 바치기 전에는 물러설 수 없다는 것을, 대내외에 천명할 필요가 있다'라고 판단했다. 김구는 1945년 8월 11일 국무회의를 개최하여 '광복군 국내정진군' 창설 안을 통과시켰다. 8월 13일 광복군 제2지대장 이범석 장군을 사령관으로 임명하였다. '광복군 국내정진군' 임무는 '즉시 서울로 진격하여 조선 총독 아베노부유키(阿部信行)로부터 무조건 항복을 받고 일본군사령부를 접수'하는 것이었다. 이는 빨리 광복군을 국내로 진입시켜, 미국 협력하에 일본군 무장을 해제하고, 치안을 유지하여 건국의 기틀을 다지도록 하기 위함이었다.  '광복군 국내정진군' 이범석 사령관은, 사령관으로 임명받자마자 주요 직위자들을 소집하여 아래와 같이 지시하였다. "오늘 또는 내일 중으로 여기 모인 동지들과 함께 국내로 들어갈 계획입니다. 오늘(8월 11일) 아침 임시정부는 나에게 국내정진군 사령관 직책을 맡겨주었습니다. 국내에 누구보다도 빨리 들어갈 수 있는 길이 생겼습니다. 다름 아니라, 미국 중국전구사령부가 곧 사절단을 서울로 들여보낼 예정입니다. 우리도 그편에 편승하라는 지시가 하달되었습니다. 우리의 임무는 대단히 무겁습니다. 첫째 국내에 진입하는 대로 일본군에게 강제로 징병당한 우리 병사들을 인수하는 것입니다. 둘째 일본군 무기를 접수하는 것입니다. 셋째 국민 자위군을 조직하는 것입니다. 넷째 불순 정치 세력이 작용할 수 없는 분위기를 만드는 것입니다. 다섯째 국내의 애국지사들과 긴밀히 협조하여 임시정부와 광복군이 환국할 수 있는 발판을 마련하는 것입니다. 미군 사절단 임무는 '국내 포로수용소(지금의 서울 신광여자중·고등학교 자리)에 있는 연합국 포로 보호입니다. 지금부터 국내진공작전을 서둘러 주시기 바랍니다" 맨 앞줄 좌로부터 박찬익, 조완구, 김구, 이시영, 차이석. 두 번째 줄 맨 왼쪽 성주식, 김문호, 신정숙, 김붕준. 맨 뒷줄 왼쪽부터 조성환, 조소앙, 지청천, 이범석, 이름 미상. [사진= 위키백과] 1945년 8월 18일 05:00 이범석 장군 등 '광복군 국내정진군'을 태운 미 C46형 항공기가 중국 서안 비행장을 이륙하였다. 하늘은 구름 한 점 없이 맑았다. 하늘과 바다를 구별할 수 없는 벽천(碧天)이었다. 항공기가 갑자기 고도를 낮추기 시작했다. 잔잔하고 파란 바다에 조그마한 섬들이 뚜렷이 보였다. 인천 앞 바다였다. 초시계 바늘은 12:00를 지나고 있었다. 이범석 장군이 붉어진 눈에 손수건을 갖다 댔다. 조국을 떠난 지 만 30년 만에 고국으로 돌아오는 감격의 눈물이었다. 이 장군은 종이에 무엇인가를 열심히 적고 있었다. 보았노라 우리 연해의 섬들을왜놈의 포화 빗발친다 해도비행기 부서지고 이 몸 찢기어도찢긴 몸 이 연해에 떨어지리니물고기 밥이 된들 원통치 않으리우리의 연해 물 마시고 자란 고기들그 물고기 살찌게 될테니... 서해를 건너며 '광복군 국내정진군'은 5분 간격으로 일본군 측에 무전을 타전했다. 그러나 일본군 측은 아무런 회신을 보내지 않았다. 고도를 바짝 낮춘 항공기가 한강을 따라 영등포 상공에 이르렀을 때 일본군 측에서 "여의도에 착륙하라"라는 답전이 왔다. 이때 모습을 장준하는 그가 쓴 '돌베게'에서 다음과 같이 기록했다. "영등포를 지났다. 그러나 또 한 번 선회한다. 아니 두 번, 폭음이 커진다. 여의도 활주로를 향해 허전허전하게 수송기가 꺼지는 듯이 고도를 낮추었다. 일장기를 붙인 수많은 일군 비행기가 기창으로 지나갔다. 중형전차도 보였다. 이제 곧 일본군이 나타나겠구나. 그들의 얼굴을 맞보게 되리라. 주먹이 쥐어졌다. 무기를 쥔 손이 땀에 스몄다. 덜컹하고 활주로에 수송기가 닿았다. 가벼운 진동에 몸이 흔들렸다. 납덩이 속을 밀치고 나가듯이 순간순간이 이어지며 비행기가 앞으로 나아갔다. 프로펠러가 소리를 뿜으면서 기수가 돌려졌다. 어느 한 격납고 앞 광장에서 비행기가 멎었다. 숨이 탁 막혔다. 기체 안의 공기가 갑자기 없어진 듯이 가슴이 답답해 왔다. 이윽고 문이 열렸다. / 변상문 국방국악문화진흥회 이사장   2025-09-22 08:00
사진
李대통령 22~26일 유엔총회 참석 [서울=뉴스핌] 박찬제 기자 = 이재명 대통령이 80차 유엔총회 고위급 회기 참석을 위해 오는 22일부터 26일까지 미국 뉴욕을 방문한다. 이 대통령은 유엔총회 기조연설을 하고 대한민국 대통령으로는 처음 안전보장이사회 토의를 주재한다. 위성락 대통령실 국가안보실장은 19일 오후 용산 대통령실 기자간담회에서 이 대통령의 유엔총회 참석 일정을 밝혔다. 이 대통령은 우선 22일 뉴욕에 도착해 세계경제포럼 의장인 래리 핑크 블랙록 회장을 만나 인공지능(AI)과 에너지 전환에 관한 협력 방안을 논의한다. 이 대통령은 미국 상·하원 의원단을 접견해 한미관계 발전을 위한 의회의 역할도 당부한다. 뉴욕에 거주하는 한인동포 간담회도 한다. 여러 세대에 걸쳐 다양한 분야에서 활동하는 뉴욕 한인 동포들과 자리한다. [워싱턴 로이터=뉴스핌] 이재명 대통령이 25일(현지시간) 미국 워싱턴 D.C. 백악관에서 도널드 트럼프 대통령과 정상회담을 앞두고 인사를 나누고 있다. 2025.08.26 photo@newspim.com 다음 날인 23일에는 유엔총회 고위급 회기 기조연설을 한다. 이 대통령은 190여 개 국가 정상들 중 7번째로 기조연설에 나선다.  위 실장은 "전 세계 정상이 모이는 자리인 만큼 대한민국 대외정책을 천명하는 주요 무대가 될 것"이라며 "민주주의 대한민국 복귀를 선언하고 한반도 정책 등 한국 정부의 외교 비전을 제시하고 인류 평화와 번영을 이뤄나가기 위한 방안을 설명할 것"이라고 말했다. 23일 오후에는 안토니우 구테흐스 유엔 사무총장을 면담하고 글로벌 현안 대응과 관련해 유엔 중심의 다자주의 강화 방안을 논의한다. 한반도 평화 정착을 위한 유엔 총장의 지지도 당부할 예정이다. 저녁에는 미 조야의 오피니언 리더와 만찬을 하면서 한미관계 발전 방안에 대한 제언을 듣고 의견을 나눈다.  뉴욕 방문 사흘째인 24일 오후 3시에는 이 대통령이 한국 대통령으로는 처음으로 유엔 안보리 공개 토의를 주재한다. AI와 국제평화 안보 주제 회의에서 '모두의 AI 기조와 국제사회 평화 안보 공동 대응'에 대한 논의를 주도할 예정이다. 마지막 날인 25일 오전에는 미 금융가 월가와 한국 금융계 인사들이 참여하는 대한민국 서밋 행사에 참석한다. 이 대통령은 글로벌 핵심 투자자들을 만나 한국 정부의 정책을 소개하고 한국에 대한 투자를 요청할 방침이다. 위 실장은 "이 자리를 통해 코리아 디스카운트를 넘어서 '코리아 프리미엄'을 본격적으로 알려 연중 최고가를 경신 중인 한국 증시에도 활력이 돌 것으로 기대한다"고 설명했다.  pcjay@newspim.com 2025-09-19 14:46
기사 번역
결과물 출력을 준비하고 있어요.
기사제목
기사가 번역된 내용입니다.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동