NL-262, Reducing hallucination in structured outputs via Retrieval-Augmented Generation, NAACL industry 2024

Abstract 생성형 AI(GenAI)의 현재 한계 중 하나는 **환각(hallucination)**을 일으키는 경향입니다. 대형 언어 모델(LLM)이 전 세계적으로 주목받고 있지만, 이러한 환각 문제를 제거하거나 최소한 줄이지 않으면, 실제 환경에서 GenAI 시스템이 사용자에게 널리 채택되기는 어려울 수 있습니다. 우리는 자연어 요구사항으로부터 워크플로우를 생성하는 엔터프라이즈 애플리케이션을 배포하는 과정 에서, 해당 워크플로우를 구조화된 출력으로 표현하는 품질을 향상시키기 위해 RAG(Retrieval-Augmented Generation) 방식을 활용한 시스템을 고안했습니다. 우리의 RAG 구현 덕분에, 제안하는 시스템은 환각을 현저히 줄일 수 있었고 , LLM이 **도메인 외 입력(out-of-domain)**에도 잘 일반화될 수 있도록 만들었습니다. 또한, 작고 잘 훈련된 retriever를 사용하면 LLM의 크기를 줄일 수 있음 을 보여주었으며, 성능 저하 없이도 자원 소모를 줄인 LLM 기반 시스템 배포가 가능 하다는 것을 입증했습니다. 1 Introduction 대형 언어 모델(LLM)의 등장으로, 자연어를 코드나 SQL 같은 구조화된 출력 으로 변환하는 작업이 상업적으로 실현 가능 해졌습니다. 비슷한 응용 사례로는, 자연어 요구사항을 워크플로우 로 번역하는 작업이 있습니다. 이 워크플로우는 여러 단계와 그들 간의 논리적 관계를 나타내며, 특정 조건이 만족될 때 자동으로 실행되는 프로세스 를 포함합니다. 이러한 자동화는 직원의 생산성을 향상시킵니다. 기업용 시스템은 반복적인 작업을 자동화하고 프로세스를 표준화하는 기능을 제공하지만, 워크플로우를 구성하려면 전문 지식이 필요하기 때문에 진입 장벽이 높습니다. 그러나 생성형 AI(GenAI)는 사용자가 자연어만으로 원하는 작업 흐름을 지정 할 수 있게 하여 이 장벽을 낮출 수 있습니다. 하지만 모든 GenAI 응용과 마찬가지로, LLM을 그대로 사용할 경우 신뢰할 수 없는 출력...