[단독] 3천억 디지털뉴딜 사업에 '복사·붙이기·해외DB 도용'

기사입력 : 2020년12월02일 06:00

최종수정 : 2020년12월02일 06:00

AI학습용 데이터구축 사업, 넉달간 2925억원 졸속 집행
"데이터 품질이 AI사업 성공의 핵심…초기 관리 철저해야"
NIA "품질문제 일부 있을 수도"...TTA "오류개선 노력중"

[서울=뉴스핌] 이서영 기자 = 정부가 3000억원 가량을 쏟아부은 'AI학습용 데이터구축' 사업이 시작부터 삐걱거리고 있다. 지난 9월 공모를 통해 584개에 이르는 기업과 기관으로부터 수집한 데이터 중 활용 불가한 '저품질 데이터'가 걸러지지 않았다는 지적이다.

이번 사업의 데이터 품질관리를 담당하는 스타트업 내부 관계자에 따르면 이번 과제에 선정된 참여 기업의 경우 몇백 억개 데이터를 모아야 하는데도 불구하고 기본 천여 개 정도 데이터만 모은 뒤, 복사와 붙여넣기 등의 방법으로 제출한 경우가 포착됐다. 또, 유명 데이터 셋인 MS코코(COCO, Common Object in COntext)나 구글 오픈 이미지 등의 해외 데이터를 그대로 가져온 경우도 더러 드러났다는 것.

'AI 학습용 데이터 구축' 사업은 한국정보화진흥원(NIA) 주관 아래 지난 9월부터 12월까지 진행중이다. 예산은 2925억원. 사업은 자연어·헬스케어·자율주행 등 150개 과제이며 참여 기업과 기관도 584개다. 다만 공모 선정기업들의 데이터에서 발견되는 '저품질' 이슈는 향후 관련사업 진행에 상당한 애로가 될 수 있다.

사실 '데이터 품질'은 AI 서비스의 신뢰성과 안정성으로 이어진다. 사업을 주관하는 NIA가 발간한 'AI 학습용 데이터 사업의 실효성 향상을 위한 정책 방향' 보고서에 따르면 아주 작은 실수로도 실제 쓸 수 없는 정밀도가 나오는 경우가 많아 성능적 측면에서 품질 관리는 상당히 중요하다.

다시말해, 유사 데이터를 그대로 복사·붙여넣기 하는 경우 AI로 활용되기 어렵다는 의미다. 또 해외 데이터인 코코나 구글 오픈 이미지의 데이터를 그대로 가져오는 것 역시 의미가 없다. 해당 정보는 이미 오픈돼 벌써 활용되고 있기 때문이다.

특히 'AI 학습용 데이터 구축 사업'은 정부가 제시한 '디지털 뉴딜'의 핵심 토대가 되는 사업이다. '디지털 뉴딜'을 위해 2025년까지 D·N·A(데이터, 네트워크, AI) 생태계를 만들어야 하고, 이를 위해선 생태계가 제대로 작동하도록 하는 '데이터 구축'이 필수. 정부는 앞서 2025년까지 D·N·A 기반 생태계를 만들기 위해 총 38조5000억 투입 계획을 밝히기도 했다.

[서울=뉴스핌] 이서영 기자 = 한국판 뉴딜의 큰 축, 디지털 뉴딜사업. 2020.12.01 jellyfish@newspim.com

이에 대해 NIA 측은 "품질이 안 좋다고 말한 곳이 어디인지 모르겠지만 전체 150종 데이터를 다루는데 품질이 좋지 않은 일부가 있을 수는 있다"면서 "다만 이것이 전체를 대표하는 것은 아니다"는 입장이다.

품질관리에도 만전을 기하고 있다고 강조했다. 품질관리를 맡은 한국정보통신기술협회(TTA)측 AI 담당자는 "사업 기간이 짧은데 비해 종류는 150종이다보니 저품질 데이터가 생산될 수는 있다"면서도 "그래도 짧은 기간 동안 품질 검증을 해 오류를 개선하려고 노력 중"이라고 답했다.

그러면서 유사 데이터 등 저품질 데이터 문제에 대해 "간혹 작업자들 오류로 비슷한 데이터가 연달아 올라오는 경우도 있다고 듣긴 했다"며 "이에 같은 카테고리 내에서 유사 데이터가 20-30개 이상이 되지 않도록 가이드라인은 제시했다"고 했다.

jellyfish@newspim.com

[관련기사]

[관련키워드]

데이터 인공지능 인공지능 학습용 데이터 AI 학습용 데이터 디지털 뉴딜 한국판 뉴딜 데이터 댐 AI 데이터 셋 MS코코 구글 오픈 이미지

GAM - 해외주식 투자 도우미

애로우헤드 ② 고중성지방혈증 적응증 확대 기대감 고조

애로우헤드 ① 플로자시란 임상 3상 잭팟에 52주 최고가

[홍콩 대장주] 메이퇀 ③ 신성장 동력의 '폭발적 성장'

[홍콩 대장주] 메이퇀② 실적은 고속 상승, 밸류는 역대 저점

[뉴스핌 베스트 기사]

사진

北TV "오늘 시간당 50~80㎜ 폭우" [서울=뉴스핌] 이영종 통일북한전문기자 = 북한 조선중앙TV가 23일 황해도와 강원도 지역에 폭우와 많은 비가 내릴 예정이라면서 '중급경보'를 알렸다. 중앙TV는 이날 오전 10시 보도 맨 앞머리에 "황해도와 강원 국부적 지역에 시간당 50~80mm의 폭우와 80~150mm의 많은 비가 내리겠다"고 전했다. [서울=뉴스핌] 이영종 통일북한전문기자 = 북한 조선중앙TV가 23일 황해도와 강원도 지역에 폭우와 많은 비가 내릴 예정이라면서 '중급경보'를 알렸다. [사진=조선중앙TV] 2026.07.23 yjlee@newspim.com 또 "개성과 강원도 여러지역과 평남, 황해도 일부 지역에 시간당 30~50mm의 폭우와 80~150mm의 많은 비가 쏟아질 예정"이라면서 '주의경보'를 내렸다. 중앙TV는 카드뉴스 형식의 보도를 통해 이날 오전 집중 강수지역의 강수량과 각 도별 평균강수량 등을 전했다. 북한 매체들은 앞서 보도를 통해 "27일까지 대부분 지역에 잦은 비가 내리겠고 국부적으로 폭우가 내릴 수 있다"면서 "23일에는 황남과 황북, 강원, 개성 등 여러지역이, 24~25일에는 중부 위주의 여러 지역에서 많은 비가 내릴 것"이라고 예보한 바 있다. 북한이 관영 선전매체를 동원해 기상특보를 실시간으로 전하며 촉각을 곤두세운 건 장마철 집중 호우로 인해 주택과 농경지 피해가 발생할 것을 우려한 때문으로 보인다. 핵과 미사일 개발에 치중해온 김정은 정권이 재난 예방 시설에 대한 투자나 대책마련을 소홀히 하면서 해마다 수해와 가뭄 등이 반복되고 있다는 지적도 나온다. 노동신문 등 매체들은 최근 집중호우로 인한 피해를 막아야 한다면서 노동당·내각 간부와 농장·기업소 간부들의 분발을 촉구하고 있다. [서울=뉴스핌] 이영종 통일북한전문기자 = 북한 조선중앙TV가 23일 황해도와 강원도 지역에 폭우와 많은 비가 내릴 예정이라면서 '중급경보'를 알렸다. 사진은 중앙TV가 전한 집중 강수지역과 강수량. [사진=조선중앙TV] 2026.07.23 yjlee@newspim.com 한편 북한은 집중 호우가 내리자 임진강 상류 황강댐을 무단 방류한 것으로 파악됐다. 북한의 무단 방류는 사전통보를 약속한 남북 간 합의 위반이다. 지난 2009년 9월에는 북한의 황강댐 무단 방류로 우리 야영객 6명이 숨지고, 차량 21대가 침수되는 등 피해가 발생한 바 있다. yjlee@newspim.com 2026-07-23 10:28

사진

원희룡, 종합특검 첫 출석 [과천=뉴스핌] 김영은 기자 = 서울-양평고속도로 노선 변경 의혹에 연루된 원희룡 전 국토교통부 장관이 23일 2차 종합특별검사팀(종합특검)에 처음으로 출석했다. 원 전 장관은 종합특검이 1년 넘게 노선 변경 특혜 의혹을 수사하다 이제 와 사업 백지화 선언으로 수사 대상을 바꾸고 있다며 혐의를 부인했다. 원 전 장관은 이날 오전 9시46분께 경기 과천시 종합특검 사무실에 직권남용 권리행사방해 혐의 피의자 신분으로 도착했다. [과천=뉴스핌] 김영은 기자 = 서울-양평고속도로 노선 변경 및 사업 백지화 의혹을 받는 원희룡 전 국토교통부 장관이 23일 2차 종합특검에 출석했다. 2026.07.23 yek105@newspim.com 그는 출석에 앞서 "1년 넘게 고속도로 특혜를 추진했다고 수사하다가 도저히 안 되는지 이제 와서는 수사 대상을 중단한 백지화 선언으로 바꿀 모양"이라고 밝혔다. 이어 "어떻게든 엮어보겠다는 의도를 가지고 있다면 마음대로 그림을 그려보라"며 "위법 사실이 없기 때문에 특검의 의도대로는 잘 안 될 것"이라고 강조했다. 다만 노선 변경 당시 김건희 여사 일가 토지와의 연관성을 알고 있었는지 묻는 질문에는 "나중에 하겠다"고 답했다. 백지화 결심 시점과 외부 지시 여부에 대해서는 답하지 않고 조사실로 향했다. 이날 특검 사무실 앞에는 오전 7시30분께부터 원 전 장관 지지자 수십명이 모였다. 인원이 늘자 경찰은 폴리스라인을 설치했고, 참가자들은 '정치특검 표적수사 국민은 안 속는다', '억지수사 중단하고 진실을 밝혀라' 등의 문구가 적힌 피켓을 들었다. 원 전 장관이 모습을 드러내자 지지자들은 그의 이름을 연호하며 "힘내라"고 외쳤다. 집회 사회자는 "원 전 장관이 사익을 추구하거나 국민에게 피해를 끼친 사실이 없다"며 "무법천지 특검은 해산하라"고 주장했다. 양평고속도로 의혹은 윤석열 정부 출범 이후 고속도로 종점이 기존 양서면에서 김 여사 일가 소유 토지가 있는 강상면 일대로 변경되는 과정에 특혜가 있었는지가 핵심이다. 종합특검은 국토부가 노선 변경을 검토하는 과정에 원 전 장관이나 대통령실 등 윗선이 개입했는지 수사해왔다. 원 전 장관은 2023년 7월 이 같은 특혜 논란이 불거지자 사업 전면 백지화를 선언했다. 종합특검은 노선 변경 의혹과 별도로 원 전 장관이 도로정책심의위원회 등 적법한 절차를 거치지 않고 사업 중단을 지시해 국토부 공무원들에게 의무 없는 일을 하게 한 것으로 의심하고 있다. 법 위반 소지가 있다는 내부 검토에도 이와 배치되는 보도자료를 배포하도록 했다는 의혹도 들여다보는 것으로 전해졌다. 앞서 종합특검은 원 전 장관에게 두 차례 출석을 통보했으나 '폐문부재'로 송달되지 않았다. 이에 지난 15일 원 전 장관의 신체와 차량을 압수수색해 휴대전화 등을 확보하고 출석요구서를 전달한 뒤 이날로 조사 일정을 조율했다. 앞서 원 전 장관을 먼저 조사했던 김건희 특검(특별검사 민중기)은 그를 피의자로 입건했지만 '윗선' 개입 여부는 결론 내지 못한 채 수사를 마무리한 바 있다. 종합특검은 이날 원 전 장관을 상대로 노선 변경과 사업 백지화 과정에 직접 개입했는지, 김 여사 일가 토지와의 연관성을 언제 인지했는지, 대통령실 등 외부와 협의하거나 지시받은 사실이 있는지 등을 집중 추궁할 전망이다. [서울=뉴스핌] 김영은 기자 = 종합특검 건물 앞에 원희룡 전 장관의 지지자들이 모여 있다. 2026.07.23 yek105@newspim.com yek105@newspim.com 2026-07-23 10:20