Definisjon
Chatbot-treningsdata består av eksempelsamtaler, intensjoner og svar som brukes til å trene samtalesystemer for AI. Det kan inkludere vanlige spørsmål, transkripsjoner og merkede dialogflyter.
Formål
Hensikten er å gi eksempler som hjelper chatboter med å forstå brukerinndata og generere passende svar. Det sikrer pålitelig ytelse i samtaler i den virkelige verden.
Viktigheten
- Bestemmer nøyaktigheten og naturen til chatbot-svar.
- Treningsdata av dårlig kvalitet resulterer i irrelevante eller feil svar.
- Må oppdateres kontinuerlig for å gjenspeile nytt språk og nye trender.
- Kan overlappe med intensjonsgjenkjenning og NLU-datasett.
Slik fungerer det
- Samle dialoger, vanlige spørsmål og støttetranskripsjoner.
- Merk data med intensjoner og enheter.
- Del opp i trenings- og valideringssett.
- Tren chatbot-modeller ved hjelp av veiledet læring eller finjustering.
- Test ytelse med brukerspørringer fra den virkelige verden.
Eksempler (den virkelige verden)
- Microsoft Bot Framework: trent på domenespesifikke chatdata.
- Google Dialogflow: bruker kommenterte intensjoner og enheter for trening.
- Finjustering av OpenAI ChatGPT: trent på kuraterte samtaler.
Referanser / Videre lesning
- Bygge chatboter — Stanford CS224U-forelesninger.
- AI-opplæringsdata for chatbot
- Utfordringen med sporing av dialogtilstand (DSTC) — Microsoft Research.
- Klemfjes – samtalebaserte AI-modeller – Klemfjes.


