네이버·LG 등 5개 팀에 고품질 데이터 제공
STEM·도서·국어학 등 희소 데이터 강점
맞춤형 공급 체계로 AI 개발 정밀 지원
[서울=뉴스핌] 양태훈 기자 = 크라우드웍스는 5일, 과학기술정보통신부가 주관하는 '독자 AI 파운데이션 모델' 프로젝트의 공동 데이터 공급 기업으로 참여한다고 밝혔다. 이 프로젝트는 글로벌 경쟁력을 갖춘 독자 AI 모델 개발을 목표로, 정부가 데이터·인재·GPU 등 전방위적 지원을 제공하는 사업이다.
앞서 정부는 네이버, LG AI연구원, NC AI, SK텔레콤, 업스테이지 등 5개 개발팀을 최종 선정했다. 이들 팀은 데이터 공동 구매(연 100억 원), 팀별 데이터셋 구축(28억 원), 방송영상 데이터 확보(200억 원) 등의 지원을 받게 된다.
크라우드웍스는 이들 개발팀이 AI 모델을 개발하는 데 활용할 고품질 학습 데이터를 제공한다. 국내 최대 규모의 AI 학습 데이터 공급사로서, 자체 검수 시스템을 통해 데이터의 전문성과 신뢰성을 확보한 것이 강점이다. 개발팀의 필요에 따라 맞춤형 데이터셋 제공도 가능하다.
![]() |
크라우드웍스 로고. [사진=크라우드웍스] |
이번 공급 대상에는 확보가 어려운 고난도 데이터셋이 대거 포함됐다. 과학(Science), 기술(Technology), 공학(Engineering), 수학(Mathematics) 등 고차원 지식이 담긴 'STEM 데이터셋', 국내 최대 규모의 도서 데이터, 국내외 뉴스, 국어학 데이터 등이 이에 해당한다. 특히 STEM 데이터는 AI의 추론, 분석, 문해 역량 강화를 지원할 수 있는 핵심 자원으로 평가된다.
김우승 크라우드웍스 대표는 "AI 모델의 성능은 데이터에 의해 결정되는 만큼, 고품질 데이터를 통해 개발팀의 기술적 성과에 기여하겠다"며 "국내외에서 검증받은 품질과 전문성을 기반으로 AI 생태계 조성에 앞장서겠다"고 전했다.
한편 크라우드웍스는 자체 플랫폼 'A1 데이터 마켓플레이스'를 통해 텍스트, 음성, 이미지, 영상, 센서 등 다양한 멀티모달 데이터뿐 아니라 산업 특화 도메인 데이터까지 제공하며 국내 데이터 생태계 활성화에 기여하고 있다.
dconnect@newspim.com