전체기사 최신뉴스 GAM
KYD 디데이
경제 과학기술

속보

더보기

서울과기대·테디썸, 라마3-70B 기반 한글 특화 LLM '블라썸' 세계최초 공개

기사입력 : 2024년05월09일 14:21

최종수정 : 2024년05월09일 14:21

라마3 70B 모델에 한국어 확장 첫 사례
업스테이지·솔트룩스·마음AI에 도전장
블라썸, 기본 모델 대비 89% 답변 향상

[세종=뉴스핌] 이경태 기자 = 국내 연구진과 인공지능(AI) 기업이 공동연구를 통해 메타의 오픈소스 거대언어모델(LLM)을 활용한 한국어 어휘 확장 대형 모델을 세계 최초로 개발했다. 

이미 오픈소스 기반 LLM 개발 업체인 업스테이지, 솔트룩스, 마음AI에 한발 앞선 기술력으로 도전장을 내민 셈이다.

서울과학기술대학교 다층퍼셉트론(MLP)연구실과 테디썸은 9일 오후께 한국어 최초 70B급 한국어-영어 초거대 언어모델 블라썸(Bllossom)을 완전 공개했다. 이는 현재 가장 좋은 성능으로 평가받는 공개 언어모델인 라마3(LLama3-70B) 기반 모델 중 어휘 확장 모델로는 전세계에서 최초로 꼽힌다.

메타는 지난달 18일(현지 시간) 자체 개발한 오픈소스 거대언어모델(LLM)인 라마(Llama)의 3세대 버전을 무료로 출시했다. 라마 3는 8B 및 70B 매개변수 두 모델로 우선 공개됐다. 라마3은 15조 개의 토큰으로 학습됐다. 

이 가운데 70B 모델은 오픈AI가 개발한 GPT-3.5보다 성능이 좋고 GPT4 성능에 근접한 수준이라는 평가를 일부 받는다. 라마3는 한국어에 특화돼 있는 모델로 평가된다.

테디썸이 라마3 70B 모델을 활용해 자체 개발한 한국어 특화 확장 거대언어모델인 '블라썸'을 허깅페이스에 9일 게재했다. 실제 전체 공개는 이날 오후께 진행된다. [사진=테디썸] 2024.05.09 biggerthanseoul@newspim.com

서울과기대와 테디썸은 라마3 70B모델에 추가적인 어휘확장을 했다.

어휘 확장은 특정 언어의 단어를 추가해 심층적인 표현이 가능하도록 하는 방법이다. 70B급 거대 언어모델은 어휘를 확장하면 새로운 어휘의 표현학습을 위해 엄청난 추가 학습시간 및 비용이 소요된다. 이렇다보니 70B급 모델에 어휘확장이 시도된 사례는 한국어에서는 아직 찾아볼 수 없다. 

이번 블라썸 모델은 서울과기대 슈퍼컴퓨팅센터의 컴퓨팅 지원을 토대로 대량의 GPU를 활용해 어휘확장 및 영어-한국어 지식 연결 학습이 가능했던 것으로 파악됐다.

임경태 서울과기대 인공지능응용학과 교수 연구팀은 이번 모델 개발을 위해 ▲한국어 표현력 강화를 위한 3만개가 넘는 한국어 어휘 추가 ▲한국어 어휘 표상 학습을 위한 대규모 사전학습 ▲한국어-영어 지식 연결을 위한 Parallel 학습 ▲한국어-영어 지식 표현을 위한 지시미세조정(Instruction Tuning) ▲사용자 피드백(feedback) 기반의 강화학습 등을 진행했다.

방대한 영어 지식을 한국어와 연결시키기 위해 직접 구축한 병렬(Parallel) 데이터 셋을 활용했다는 점과 언어학자들이 직접 구축한 정교한 지시미세조정 데이터가 성능을 크게 향상시켰다는 점이 이번 모델 개발에서 주목할 만한 요소다.

테디썸은 이번에 개발한 모델을 전체 공개해 개별적인 추가 학습과 상업적 이용이 가능하다는 점을 강조했다.

이번 모델은 한국어 토큰 확장으로 인해 25% 확장된 컨텍스트 활용이 가능하다. 인간평가와 GPT4 한국어 답변 선호도 평가 결과 GPT3.5와 유사하거나 약간 앞선 결과를 보인 바 있다. 라마3 70B 기본모델 대비 한국어 답변에 대해 89% 더 높은 답변 선호도 평가를 기록했다.

테디썸은 이미 8B 소형 모델은 전세계 기술 공유 플랫폼인 허깅페이스에 공개됐고 70B 거대모델도 이날 함께 공개했다. 개인 GPU에서 작동 가능한 4bit 양자화된 모델과 직접 활용해볼 수 있는 데모도 함께 내놓는다.

함영균 테디썸 대표는 "기존 빅테크에서만 연구개발하고 공개되지 않던 70B 거대 모델을 중소규모 회사 및 연구 그룹에서도 활용할 수 있도록 초거대 언어모델의 민주화에 기여했다는 점에서 의미있는 첫 발자국이라 생각한다"고 말했다.

한편 국내에서 라마3 소형 모델인 8B를 기반으로 자체 LLM 모델을 개발해 공개한 기업은 솔트룩스, 마음AI 등이다. AI 기업 데이터드리븐의 이준범 수석 AI 연구원도 개인적으로 8B 기반 모델을 공개한 바 있다.

biggerthanseoul@newspim.com

[뉴스핌 베스트 기사]

사진
이화영, 대법서 징역 7년8개월 확정 [서울=뉴스핌] 홍석희 기자 = 쌍방울 그룹에서 수억원대 뇌물을 받고, 800만 달러를 북한에 송금한 혐의로 기소된 이화영 전 경기도 평화부지사가 징역 7년 8개월을 확정 받았다. 대법원 2부(주심 박영재 대법관)는 5일 오전 특정범죄가중처벌등에관한법률위반(뇌물) 등 혐의로 재판에 넘겨진 이 전 부지사에게 징역 7년 8개월을 선고한 원심을 확정했다. 쌍방울 그룹에서 수억원대 뇌물을 받고, 800만 달러를 북한에 송금한 혐의로 기소된 이화영 전 경기도 평화부지사가 징역 7년 8개월을 확정 받았다. 사진은 이 전 지사가 지난해 10월 2일 오전 서울 여의도 국회 법제사법위원회에서 열린 박상용 수원지검 부부장검사에 대한 탄핵소추 사건 조사 관련 청문회에서 정청래 법사위원장 질의에 답변하는 모습. [사진=뉴스핌 DB] 이 전 부지사는 이재명 대통령이 경기지사이던 2019년, 쌍방울로 하여금 도지사 방북 비용 300만 달러와 북한 스마트팜 사업 비용 500만 달러 등 총 800만 달러를 북한 측에 보내도록 한 혐의로 기소됐다. 경기도 평화부지사, 경기도 산하기관인 킨텍스 대표로 재직 중 쌍방울로부터 법인카드와 차량 등 3억3400여만 원의 정치자금을 제공받은 혐의도 받았다. 검찰은 이중 2억5900여만 원에 대해 뇌물 혐의를 적용했다. 1심은 이 전 부지사의 혐의 대부분을 유죄로 판단해 정치자금법 위반 징역 1년 6개월, 특가법상뇌물 및 외국환거래법 위반 등 징역 8년을 합해 총 징역 9년 6개월을 선고했다. 1심 재판부는 쌍방울이 경기도 스마트팜 사업비(500만 달러)와 당시 경기지사였던 이 대통령의 방북비용(300만 달러)을 대납하려 했다는 검찰 측 판단을 모두 받아들였다. 다만 검찰이 공소사실에 적시한 총 800만 달러 중 394만 달러만 해외로 밀반출된 불법 자금으로 인정했다. 2심은 1심 판결을 파기하고, 징역 7년 8개월 및 벌금 2억5000만원, 추징 3억2595만 원으로 감형했다. 구체적으로 정치자금법 위반 혐의에 대해서는 징역 8개월을, 특가법상뇌물 및 외국환거래법 위반 등 혐의에 대해서는 징역 7년을 각각 주문했다. 1심 형량과 비교해 1년 10개월이 감형됐다. 2신 재판부는 1심과 마찬가지로 검찰이 기소한 대북송금 800만 달러 가운데 394만 달러만 북한 측에 밀반출됐다며 유죄로 판단했다. 특히 이 중 200만 달러는 김 전 회장이 이재명 당시 경기지사의 방북비용으로 대납한 것이라고 봤다. 다만 "뇌물죄, 정치자금법 위반죄 범행 후 공무원 또는 정치인으로서 부정한 행위까지 나아가지는 않은 점, 스마트팜은 인도적 지원 사업이었고 남북간 평화조성을 위한 남북교류협력사업의 추진이라는 정책적 목적도 있는 점, 김성태가 쌍방울그룹의 대북사업 추진 등 이익을 도모한 사정도 있고 피고인이 김성태에게 비용 대납을 강요한 사정은 없는 점 등을 유리한 양형으로 고려했다"고 감형 이유를 설명했다. 검찰과 이 전 부지사 측 모두 판결에 불복해 상고했으나 대법원은 양 측의 주장을 모두 받아들이지 않았다. 대법원은 "원심의 유죄 부분 판단에 필요한 심리를 다하지 않은 채 논리와 경험의 법칙을 위반해 자유심증주의 한계를 벗어나거나 검사의 사전면담 등이 이루어진 증인의 법정진술의 신빙성 판단, 유죄의 인정에 필요한 증명의 정도, 뇌물수수죄에서 직무관련성, 대가성, 뇌물귀속 주체와 고의, 정치자금 부정수수죄에서 정치자금과 고의 등에 관한 법리를 오해하는 등으로 판결에 영향을 미친 잘못이 없다"고 판시했다. hong90@newspim.com 2025-06-05 10:45
사진
외교부 장관 김현종·조현 거론 [서울=뉴스핌] 지혜진 기자= 인수위원회 없이 출범하는 새 정부는 민생 회복과 함께 대미 관세 협상 등 외교·안보 문제도 시급하다. 미국 법원에서 도널드 트럼프 대통령이 주요국을 대상으로 부과한 상호관세 효력을 정지시켰지만 여전히 통상 환경의 불확실성이 가신 것은 아니다. 지난 4일 당선된 이재명 대통령은 "국익 중심의 실용 외교" 강조해왔다. 민주당 공약집을 보면 통상환경의 변화와 경제안보 중요성에 대응하기 위해 주요 20개국(G20)·주요 7개국(G7) 등의 적극 참여를 통해 글로벌 현안 적극 대응하고 2025 경주 APEC 성공적 개최를 위한 외교역량을 강화할 것을 약속했다. 신남방·신북방 정책을 계승 발전해 글로벌 사우스와 권역별 협력을 심화하고 핵심소재·연료광물의 공급망(GVC) 안정화를 위한 통상협력 강화도 약속했다. (왼쪽부터) 김현종 더불어민주당 선대위 외교안보특보, 위성락 민주당 의원, 조현 선대위 국익중심실용외교위 공동위원장, 안규백 의원. [사진=뉴스핌DB] 북핵 대응으로는 한국형 탄도미사일 성능과 한국형미사일방어체계(KAMD)를 고도화를 내세웠다. 핵무장이나 핵잠재력 확보에 대해서는 언급하지 않았다. '북핵 대응의 기본 원칙은 한·미 확장억제 강화'라는 기존의 기조를 이어갈 것으로 예상된다. 국방 분야에서는 국방 문민화를 비롯해 군 정보기관 개혁, 육·해·공군 참모총장 인사청문회 도입 등을 내세웠다. 이 대통령은 취임 첫날 국가안보실장에 위성락 민주당 의원을 임명했다. 주러시아 대사를 지낸 외교관 출신인 위 의원은 '이재명 후보 외교안보보좌관'으로 임명돼 활동했다. 이번 대선에서는 민주당 선대위 산하 '동북아평화협력위원회' 좌장을 맡았다. 외교부 장관 후보군으로는 조현 전 외교부 1차관과 김현종 전 청와대 국가안보실 2차장이 언급된다. 조 전 차관은 선대위에서 국익중심실용외교위원회 상임공동위원장을 맡았다. 위 의원과 외무고시 13기 동기로 유엔대사, 외교부 다자외교조정관, 외교부 국제기구국장 등을 역임했다. 김 전 차장은 대선 기간에도 '이재명 후보 외교안보보좌관' 자격으로 백악관 고위 당국자들과 만나 한미동맹과 한미일 3국 협력을 강화해야 한다는 이 후보의 입장을 전달하기도 했다. 국방부 장관 자리에는 군 출신이 아닌 5선의 안규백 민주당 의원이 유력하다. 이 대통령은 후보 때부터 군에 대한 '문민 통제'를 강조해 왔다. heyjin@newspim.com 2025-06-05 06:00
안다쇼핑
Top으로 이동