정확성과 신뢰성 대폭 향상
'AI 뉴스 에이전트' 시장 본격 공략
[서울=뉴스핌] 이나영 기자= 인공지능(AI) 데이터 플랫폼 기업 비큐AI는 최근 실시한 2차 RAGAS(Retrieval-Augmented Generation Assessment) 평가에서 자사 뉴스 검색증강생성(RAG) 모델 RDP1이 모든 항목에서 업계 평균을 크게 상회하는 성능을 기록했다고 29일 밝혔다.
비큐AI RDP1은 벤치마크 테스트 기준으로 업계 상위 5~10% 수준의 고성능 RAG 시스템으로 평가받았다. 이번 평가를 통해 RDP1은 고성능 RAG 파이프라인 반열에 올라, 산업 현장에 적용 가능한 고신뢰 AI 시스템으로서 기술적 성숙도를 확인했다.
이번 2차 평가에서 RDP1은 검색 최적화와 언어모델(LLM) 교체 전략을 통해 성능을 대폭 향상시켰다. ▲문맥 정확도(Context Precision) 1.0000점 ▲문맥 회수율(Context Recall) 0.9689점 ▲사실성(Faithfulness) 0.9287점 등 전 항목에서 0.9 이상의 점수를 기록했다. 특히 문맥 정확도에서 만점을 기록한 것은 질문에 대한 문서 검색 결과가 실제 필요한 정보만을 정밀하게 포함하고 있음을 보여주며, 검색 및 청킹(Chunking) 전략 최적화의 효과를 정량적으로 입증한 결과다.
![]() |
RAGAS 결과. [사진=비큐AI] |
비큐AI는 문서 구조 개선 및 청킹 전략 정교화, 임베딩 모델과 검색 알고리즘의 고도화, LLM 교체 및 튜닝을 통해 RDP1 성능을 단계적으로 향상시켰다. 특히 LLM은 최신 경량 고속모델인 Gemini 2.5 Flash로 전환돼 답변 생성 속도와 정합성 모두에서 개선을 달성하며 전체 평균 RAGAS 점수 0.9516을 기록했다.
비큐AI는 이번 성과가 단순 성능 개선에 그치지 않고, 실제 산업 적용 가능성을 뒷받침하는 기술적 완성도를 입증하는 계기가 됐다고 강조했다. 앞서 클로즈 베타 테스트(CBT) 당시에도 평균 0.9 이상의 RAGAS 점수를 기록, 업계의 주목을 받은 바 있다.
'RDP1'은 단순 생성 품질이 아닌, 문서 기반 신뢰성과 답변 정확성, 환각 최소화에 중점을 둔 시스템 설계를 통해 기술적 완성도를 입증했다. 실제로 평가 도구로 활용된 RAGAS 프레임워크는 마이크로소프트, AWS, 메타, 오픈AI 등 글로벌 빅테크가 신뢰도 검증 수단으로 사용하는 표준화된 벤치마크다. 검색된 문서의 품질과 생성된 답변의 사실성을 함께 평가하는 것이 특징이다.
비큐AI 관계자는 "RDPLINE은 AI모델의 학습 및 추론 데이터를 공급하는 '데이터셋 공급 사업'과 AI 에이전트 플랫폼 또는 디바이스에 실시간 및 분석 데이터를 연결하는 '서비스 파이프라인 사업'으로 나뉘어 각 산업 섹터별 비즈니스 확장에 속도를 내고 있다"고 전했다. 이어 "이를 통해 AI 기반 빅테크 기업, 금융, 통신, 자동차 인포테인먼트 등 다양한 산업 분야에서 실시간 뉴스 기반의 AI 분석, 투자 포트폴리오 조정, 개인 맞춤형 뉴스 에이전트 등을 제공하는 실증 사업을 추진하고 있으며, 그 중심에는 AI 뉴스 에이전트인 'RDP1'이 핵심적인 역할을 수행할 것"이라고 밝혔다.
또 "RDP1은 단순한 답변 생성 모델을 넘어, 실제 산업의 민감한 정보 흐름 속에서도 정확하고 신뢰할 수 있는 실시간 질의응답 인프라를 제공할 수 있는 수준에 도달했다"며 "향후 다양한 글로벌 데이터의 지속적 확보를 통해 산업별 맞춤형 LLM+RAG 데이터 파이프 라인 시스템으로 확장해 나갈 계획중으로 8월중 AI 뉴스 에이전트인 RDP1의 티저 영상 및 B2B 서비스를 공개할 예정"이라고 덧붙였다.
nylee54@newspim.com