Definisjon
Retrieval-Augmented Generation (RAG) er en teknikk som kombinerer generative modeller med informasjonsgjenfinningssystemer. Den baserer resultater på eksterne kilder for å forbedre faktisk nøyaktighet.
Formål
Hensikten er å redusere hallusinasjoner i generativ kunstig intelligens ved å forsterke svar med hentede dokumenter. Det er spesielt nyttig i spørsmålssvar og kunnskapsintensive oppgaver.
Viktigheten
- Forbedrer faktisk nøyaktighet i LLM-resultater.
- Muliggjør domenespesifikk kunnskapsintegrasjon.
- Krever pålitelige gjenfinningssystemer.
- Relatert til hybridsøk og QA-vurdering av åpne domener.
Slik fungerer det
- Brukeren oppgir en forespørsel eller en ledetekst.
- Hentingssystemet henter relevante dokumenter.
- Dokumenter sendes inn i en generativ modell.
- Modellen genererer svar basert på hentet innhold.
- Tilbakemeldingsløkker forbedrer fremtidig ytelse.
Eksempler (den virkelige verden)
- OpenAI ChatGPT med plugins for nettlesing eller henting.
- Meta RAG-modell: forskning på retrieval-grounded LLMs.
- Perplexity AI: gjenfinningsutvidet samtalesøk.
Referanser / Videre lesning
- Lewis et al. «Gjenfinningsutvidet generering for kunnskapsintensiv NLP.» NeurIPS 2020.
- Implementering av RAG for klemmende ansikt.
- Stanford HAI-forskning på hentingsmetoder.
- Hva er RAFT? RAG + Finjustering


