AI Tech Briefing

긴 문서 묶음을 SQL로 묻는 SLIDERS

SLIDERS는 긴 문서 여러 개에서 근거와 이유를 표 형태로 뽑아 맞춰 둔 뒤, 그 표를 SQL로 물어 답을 찾는 긴 문서 QA 프레임워크다. 긴 컨텍스트나 RAG만으로는 어려운 ‘여러 조각의 근거를 한 번에 맞추는 일’을 따로 다룬다.

2026-04-28

왜 중요한가

  • 긴 컨텍스트 모델이 좋아져도 실제 연구실이나 조직의 문서는 금방 한 번에 넣기 어려운 양이 된다.
  • 일반 RAG는 관련 조각을 찾아오는 데 강하지만, 수백~수천 개 조각에서 나온 근거를 서로 맞춰 하나의 답으로 정리하는 일은 여전히 까다롭다.
  • SLIDERS의 핵심은 답변 직전에 문서를 더 많이 붙이는 것이 아니라, 문서 묶음을 질문에 맞는 구조화된 표로 바꾼 뒤 SQL로 묻는 데 있다.
  • 논문, 회의록, 실험 메모, 운영 문서가 계속 쌓이는 환경에서는 단순 검색보다 ‘어느 문서의 어떤 근거에서 나온 값인가’를 남기는 중간 표가 더 중요해질 수 있다.

해석

이 접근이 눈에 띄는 이유는 긴 문서를 한 번에 더 많이 읽히려 하기보다, 먼저 질문에 필요한 근거를 출처와 함께 정리해 두고 그 위에서 계산·비교하게 한다는 점이다.

그래서 SLIDERS는 RAG를 완전히 대체한다기보다, 검색 이후에 남는 중복·충돌·누락 문제를 표와 SQL 단계로 분리해 다루는 설계에 가깝다.

누구에게 도움이 되나

  • 엔터프라이즈 리서치팀: 금융 보고서, 정책 문서, 계약서, 시장조사 자료를 여러 개 비교하는 analyst workflow
  • 법무/컴플라이언스팀: 근거 quote와 rationale을 남기면서 문서 묶음에서 조건·예외·수치를 질의하는 workflow
  • 의료/임상 리서치팀: trial report나 guideline을 비교하되, 답변 근거를 table/provenance로 감사해야 하는 경우
  • RAG 제품팀: chunk retrieval 이후 aggregation bottleneck을 SQL state/reconciliation으로 분리하는 architecture 참고

어디에 바로 써볼 수 있나

  • 여러 논문·보고서·실험 로그에서 숫자, 조건, 비교 항목을 뽑아야 할 때 schema-pinned extraction + SQL answer 흐름을 참고할 수 있다.
  • 회의록/행정 문서/프로젝트 로그를 장기 축적할 때, 매번 긴 context에 넣기보다 provenance가 붙은 중간 테이블을 만들고 질의하는 구조를 실험할 만하다.
  • memory/RAG 답변에서 중복·충돌·누락을 줄이려면 retrieval 다음 단계에 reconciliation table을 두는 패턴이 유용하다.
  • 특히 raw/knowledge 운영에서는 어느 파일의 어느 quote가 어떤 field로 들어갔는가를 보존하는 설계가 답변 감사와 수정에 도움이 된다.
  • 금융 보고서, 정책 문서, 계약서, 시장조사 자료를 여러 개 비교하는 analyst workflow
  • 근거 quote와 rationale을 남기면서 문서 묶음에서 조건·예외·수치를 질의하는 workflow
  • trial report나 guideline을 비교하되, 답변 근거를 table/provenance로 감사해야 하는 경우
  • chunk retrieval 이후 aggregation bottleneck을 SQL state/reconciliation으로 분리하는 architecture 참고

주요 출처

공식 repo / docs

주의점

  • LLM 호출이 여러 단계에 들어가므로 단순 RAG보다 비용과 응답 시간이 커질 수 있다.
  • 처음에 어떤 표 구조를 만들고 값을 어떻게 뽑느냐가 틀리면, SQL이 맞게 돌아가도 최종 답은 틀릴 수 있다.
  • 관계형 표로 담기 어려운 암묵적 맥락, 서사, 복잡한 인과관계는 중간 과정에서 빠질 수 있다.
  • Windows에서는 여러 파일을 직접 입력할 때 symlink 권한 문제가 확인됐다. 디렉터리 입력을 쓰거나 copy fallback 패치가 필요하다.
  • 이번 확인에서는 API credential이 없어 실제 답변 생성까지는 재현하지 못했다.
  • README와 논문의 수치는 공개된 주장 기준이다. 같은 조건의 독립 benchmark를 돌리기 전까지는 보수적으로 보는 편이 맞다.

다음에 볼 포인트

  • 우리 raw/knowledge 일부에 사람이 schema를 고정한 작은 prototype을 붙였을 때 실제로 중복·충돌·누락이 줄어드는지 볼 것.
  • Windows 파일 입력 문제에 대해 directory input이나 copy fallback 패치가 실사용에 충분한지 확인할 것.
  • 긴 컨텍스트, 일반 RAG, SLIDERS식 중간 표 접근을 같은 문서 묶음과 질문으로 비교한 재현 결과가 나오는지 지켜볼 것.