전체기사 최신뉴스 GAM
KYD 디데이

[단독] 3천억 디지털뉴딜 사업에 '복사·붙이기·해외DB 도용'

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

AI학습용 데이터구축 사업, 넉달간 2925억원 졸속 집행
"데이터 품질이 AI사업 성공의 핵심…초기 관리 철저해야"
NIA "품질문제 일부 있을 수도"...TTA "오류개선 노력중"

[서울=뉴스핌] 이서영 기자 = 정부가 3000억원 가량을 쏟아부은 'AI학습용 데이터구축' 사업이 시작부터 삐걱거리고 있다. 지난 9월 공모를 통해 584개에 이르는 기업과 기관으로부터 수집한 데이터 중 활용 불가한 '저품질 데이터'가 걸러지지 않았다는 지적이다. 

이번 사업의 데이터 품질관리를 담당하는 스타트업 내부 관계자에 따르면 이번 과제에 선정된 참여 기업의 경우 몇백 억개 데이터를 모아야 하는데도 불구하고 기본 천여 개 정도 데이터만 모은 뒤, 복사와 붙여넣기 등의 방법으로 제출한 경우가 포착됐다. 또, 유명 데이터 셋인 MS코코(COCO, Common Object in COntext)나 구글 오픈 이미지 등의 해외 데이터를 그대로 가져온 경우도 더러 드러났다는 것.

'AI 학습용 데이터 구축' 사업은 한국정보화진흥원(NIA) 주관 아래 지난 9월부터 12월까지 진행중이다. 예산은 2925억원. 사업은 자연어·헬스케어·자율주행 등 150개 과제이며 참여 기업과 기관도 584개다. 다만 공모 선정기업들의 데이터에서 발견되는 '저품질' 이슈는 향후 관련사업 진행에 상당한 애로가 될 수 있다.

사실 '데이터 품질'은 AI 서비스의 신뢰성과 안정성으로 이어진다. 사업을 주관하는 NIA가 발간한 'AI 학습용 데이터 사업의 실효성 향상을 위한 정책 방향' 보고서에 따르면 아주 작은 실수로도 실제 쓸 수 없는 정밀도가 나오는 경우가 많아 성능적 측면에서 품질 관리는 상당히 중요하다.

다시말해, 유사 데이터를 그대로 복사·붙여넣기 하는 경우 AI로 활용되기 어렵다는 의미다. 또 해외 데이터인 코코나 구글 오픈 이미지의 데이터를 그대로 가져오는 것 역시 의미가 없다. 해당 정보는 이미 오픈돼 벌써 활용되고 있기 때문이다.

특히 'AI 학습용 데이터 구축 사업'은 정부가 제시한 '디지털 뉴딜'의 핵심 토대가 되는 사업이다. '디지털 뉴딜'을 위해 2025년까지 D·N·A(데이터, 네트워크, AI) 생태계를 만들어야 하고, 이를 위해선 생태계가 제대로 작동하도록 하는 '데이터 구축'이 필수. 정부는 앞서 2025년까지 D·N·A 기반 생태계를 만들기 위해 총 38조5000억 투입 계획을 밝히기도 했다.

[서울=뉴스핌] 이서영 기자 = 한국판 뉴딜의 큰 축, 디지털 뉴딜사업. 2020.12.01 jellyfish@newspim.com

 

이에 대해 NIA 측은 "품질이 안 좋다고 말한 곳이 어디인지 모르겠지만 전체 150종 데이터를 다루는데 품질이 좋지 않은 일부가 있을 수는 있다"면서 "다만 이것이 전체를 대표하는 것은 아니다"는 입장이다.

품질관리에도 만전을 기하고 있다고 강조했다. 품질관리를 맡은 한국정보통신기술협회(TTA)측 AI 담당자는 "사업 기간이 짧은데 비해 종류는 150종이다보니 저품질 데이터가 생산될 수는 있다"면서도 "그래도 짧은 기간 동안 품질 검증을 해 오류를 개선하려고 노력 중"이라고 답했다.

그러면서 유사 데이터 등 저품질 데이터 문제에 대해 "간혹 작업자들 오류로 비슷한 데이터가 연달아 올라오는 경우도 있다고 듣긴 했다"며 "이에 같은 카테고리 내에서 유사 데이터가 20-30개 이상이 되지 않도록 가이드라인은 제시했다"고 했다.

jellyfish@newspim.com

[뉴스핌 베스트 기사]

사진
음주운전 부장판사 감봉 3개월 징계 [서울=뉴스핌] 홍석희 기자 = 서울중앙지법 소속 현직 부장판사가 음주운전으로 감봉 처분을 받았다. 23일 법조계에 따르면 대법원은 지난 3일 서울중앙지법 A 부장판사에게 감봉 3개월 징계를 내렸다. A 부장판사는 지난해 12월 13일 오후 3시 1분께 면허 정지 수준인 혈중알코올농도 0.071% 상태로 중랑구 사가정역 근처 한식당에서 약 4㎞가량 승용차를 운전하다 적발된 것으로 알려졌다. 대법원은 "법관으로서의 품위를 손상하고 법원의 위신을 떨어뜨렸다"고 했다. A 부장판사는 현재 서울중앙지법 민사 재판부에 소속돼 있다. 서울중앙지법 소속 현직 부장판사가 음주운전으로 감봉 처분을 받았다. 서울 서초동 서울중앙지법. [사진=뉴스핌DB] hong90@newspim.com 2026-02-23 09:29
사진
'재명이네 마을'서 정청래 강제 퇴출 [서울=뉴스핌] 조승진 기자 = 정청래 더불어민주당 대표와 이성윤 최고위원이 이재명 대통령의 팬 카페인 '재명이네 마을'에서 강제 퇴출당했다. 네이버 카페 '재명이네 마을' 운영진은 22일 정 대표와 이 최고위원의 강제 탈퇴에 관한 투표 결과 이들의 강퇴가 확정됐다고 밝혔다. 투표 결과에 따르면 전체 투표수 1231표 중 찬성 1001표(81.3%), 반대 230표(18.7%)였다. '재명이네 마을' 카페에 올라온 더불어민주당 정청래 대표와 이성윤 최고위원이 강제 탈퇴 공지. [사진=카페 캡쳐] 운영진은 "정청래, 이성윤 의원은 마을에서 재가입 불가 강제 탈퇴 조치된다"고 했다. 운영진은 "분란을 만들고 아무것도 책임지지 않는 당 대표, 사퇴하라 외쳐 보지만 '너희들은 짖어라' 하는 듯한 태도"라며 "한술 더 떠 정치 검찰 조작 기소 대응 특위 수장으로 이성윤을 임명하며 분란에 분란을 가중하는 행위에 더 이상 용납이 되지 않는다"고 했다. 이어 "한때는 이 마을에도 표심을 얻기 위해 뻔질나게 드나들며 수많은 글을 썼었지만, 지난 당 대표 선거 당시 비판받자 발길을 끊었다"며 "필요할 때는 그렇게 마을을 이용하더니 달면 삼키고 쓰면 뱉는가? 우리가, 지지자들이 그렇게 만만한가?"라고 했다. 또 "이곳 '재명이네 마을'은 오직 이재명 대통령을 최우선으로 지지하는, 존경하고 사랑하는 공간"이라며 "운영자로서 할 수 있는 소심한 조치는 그저 이 공간에서 강퇴하는 것뿐이라 판단한다"고 했다. 그러면서 "이 마을은 운영자 개인 것이 아닌, 마을 주민들과 함께 가꿔온 소중한 공간이므로 이 절차에 대해 주민들과 소통하여 진행하고자 한다"며 "그 결과는 온전히 당 대표께서 받아들이시라"고 했다. '재명이네 마을' 매니저는 그동안 정 대표와 이 최고위원이 이 대통령의 행보와 엇박자를 보이며 당내 분란을 일으켰다고 주장했다. 특히 정 대표가 강행한 조국혁신당과의 합당 제안, '1인 1표제' 추진 등을 문제라고 봤다. 이 최고위원에 대해서는 특검 후보 추천 논란과 '1인 1표제' 관련 중앙위원회 투표 과정에서 제기된 사찰 의혹 등을 강퇴 배경으로 설명했다.  chogiza@newspim.com 2026-02-23 11:30
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동