박찬영 교수팀, 정점 레이블 없이도 그래프
신경망 모델 훈련하는 인공지능 방법론 제시
10월 국제학술대회 'CIKM 2022' 발표 예정
최신 연구 방법론 대비 최대 6% 정확도 향상
[세종=뉴스핌] 이태성 인턴기자 = 최근 소셜 네트워크 분석, 추천 시스템 등의 분야에서 그래프 데이터의 중요성이 대두되는 가운데 데이터가 충분하지 않은 상황에서도 높은 예측 정확도를 달성하는 그래프 신경망 모델 훈련 신기술이 개발됐다.
25일 KAIST(총장 이광형)는 산업및시스템공학과 박찬영 교수 연구팀이 데이터의 레이블이 없는 상황에서도 높은 예측 정확도를 달성할 수 있는 새로운 그래프 신경망 모델 훈련 기술을 개발했다고 밝혔다.
[사진=KAIST] KAIST 산업및시스템학과 박찬영 교수 2022.10.25 victory@newspim.com |
박 교수 연구팀이 개발한 기술은 그래프 신경망 모델에서 정점들 사이의 관계를 보존해 정점의 레이블이 없는 상황에서 모델을 훈련시켜 높은 예측 정확도를 달성할 수 있게 해주는 기술이다.
연구팀 관계자는 "기존의 훈련 방법은 표상 공간에서 자신을 제외한 다른 정점들과의 유사도가 작아지도록 훈련을 하지만 이런 일차원적인 방법론은 정점 간의 관계를 정확히 반영하지 못하게 된다"고 설명했다.
[사진=카이스트] 연구팀에서 개발한 '관계 보존 학습' 방법론. 기존 방법론과 달리 데이터 증강 기법을 통해 생성된 두 개의 그래프를 기반으로 노드들 사이의 관계를 보존하면서 모델이 학습된다. 예측 정확도 향상을 다양한 실험을 통해서 입증했다. 2022.10.25 victory@newspim.com |
KAIST 산업및시스템공학과 이남경 석사과정, 현동민 박사, 이준석 석사과정 등이 참여한 이번 연구는 국제학술대회 '정보지식관리 콘퍼런스(CIKM) 2022'에서 올 10월 발표될 예정이다. (논문명: Relational Self-Supervised Learning on Graphs)
연구팀이 '관계 보존 학습'이라고 이름지은 이번 학습 방법론은 최신 연구 방법론과 비교했을 때 정점 분류 문제에서 최대 3% 예측 정확도를 향상시켰다. 간선 예측 문제에서는 6%의 성능 향상, 다중 연결 네트워크 (Multiplex network)의 정점 분류 문제에서는 3%의 성능 향상을 보였다.
[사진=카이스트] 본 연구에서 제안하는 '관계 보존 학습' 모델의 구조 2022.10.25 victory@newspim.com |
제1저자인 이남경 석사과정은 "이번 기술은 데이터의 레이블이 부재한 상황에서도 그래프 신경망을 학습할 수 있는 새로운 방법ˮ이라며 "그래프 기반의 데이터뿐만 아니라 이미지 텍스트 음성 데이터 등에 폭넓게 적용될 수 있어 심층 학습 전반적인 성능 개선에 기여할 수 있다ˮ고 밝혔다.
연구팀을 지도한 박찬영 교수도 "이번 기술은 그래프 데이터상에 레이블이 부재한 상황에서 표상 학습 모델을 훈련하는 기존 모델들의 단점들을 `관계 보존`이라는 개념을 통해 보완해 새로운 학습 패러다임을 제시했다ˮ고 설명했다.
한편 이번 연구는 과학기술정보통신부 재원으로 정보통신기획평가원의 지원을 받아 사람중심인공지능핵심원천기술개발 과제로 개발한 연구성과 결과물(No. 2022-0-00157, 강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습)이다.
victory@newspim.com