Samling av tekstytringer

Hvorfor din samtale-AI trenger gode ytringsdata?

Har du noen gang lurt på hvordan chatboter og virtuelle assistenter våkner når du sier «Hei Siri» eller «Alexa»? Det er på grunn av innsamlingen av tekstytringer eller utløser ord innebygd i programvaren som aktiverer systemet så snart det hører det programmerte våkneordet.

Den generelle prosessen med å lage lyder og ytringsdata er imidlertid ikke så enkel. Det er en prosess som må gjennomføres med riktig teknikk for å få ønsket resultat. Derfor vil denne bloggen dele veien til å lage gode ytringer/triggerord som fungerer sømløst med din samtale-AI.

Hva er ytringer?

Ytringer kan refereres til som fraser eller triggerord som brukes til å aktivere en kunstig intelligent modell. Når AI-modellen din oppdager våkenordet, begynner den automatisk å registrere brukerens neste forespørsel og svarer med en passende handling eller svar.

Utterance bruker konseptet dyp læring for å lære programvaren hvordan den gjenkjenner våkne ord. Når wake word aktiverer programvaren, begynner systemet å fange, dekode og betjene forespørselen. Når det ikke er i bruk, fortsetter systemet passivt å lytte etter triggerord.

For at AI-programvaren din skal oppnå nøyaktige resultater, er det viktig å fange opp en mengde forskjellige ytringer for enhver hensikt. Det hjelper med bedre trening for AI-modellen.

[Les også: Vil du vite hvordan Siri og Alexa forstår deg?]

Poeng å huske når du oppretter et arkiv med ytringer

Nå som vi vet at trening er viktig for AI-modeller, er neste ting å vite hvordan man kan gi ytringer til AI-modellene. Vanligvis opprettes et arkiv med ytringer for å trene samtale-AIer.

Det er imidlertid forskjellige ting å huske på når du bygger arkiver for ytringer. Følgende er ting du bør vurdere:

Poeng å huske for å samle gode ytringer

Brukerhensikt

Først og fremst mens du forbereder ytringer for AI-modellen din, sørg for at du forstår brukerhensikten du utvikler datasettene for. Du må finne ut de forskjellige ytringene som brukere kan skrive inn mens de snakker med AI-modellen.

Variasjon av ytringer

Variasjoner er en viktig del av denne prosessen, ettersom jo flere variasjoner for hver hensikt, jo bedre resultater vil du oppnå. Så sørg for å lage flere varianter av brukerytringer. Du kan gjøre det ved å

  • Lage korte, mellomstore og store setninger for de samme setningene.
  • Endre ordene og lengden på setninger.
  • Bruke unike ord.
  • Pluralisering av setningene.
  • Blander sammen grammatikken.

Ytringer er ikke alltid godt utformet

De fleste har for vane å bruke fragmenterte setninger i samtalene sine. Når de har å gjøre med roboter, ønsker de å ha den samme bekvemmeligheten. Derfor bør du ikke bare inkludere de fullstendig strukturerte setningene, men også legge til skrivefeil, feilstavinger og løst nevnte setninger i treningsdataene dine.

Utnytt representantens vilkår og referanser

Når du lager ytringer, bruk standardterminologi og referanser som folk flest forstår. Husk at du ikke trenger å bygge en stor robot som bruker et sofistikert språk som bare eksperter kan få. Fokuser heller på å formulere ytringer som er svært vanlige og lett forståelige for alle.

Varier fraser og terminologi

En vanlig feil som mange AI-trenere ofte gjør, er at de bruker en rekke setninger, men ikke endrer nøkkelordene i dem. Anta for eksempel at du lager ytringer som "I hvilket rom er fjernsynet?", "Hvor er fjernsynet?", "hvor finner jeg fjernsynet?".

Setningene kan endres i alle disse ytringene, men grunnordet 'TV' forblir det samme. Så du må sørge for at du bruker varianter for alt du skriver inn. Så i stedet for fjernsyn kan du bruke synonymer for ordet.

Eksempel på ytringer for hver hensikt

Eksempler på ytringer tilordnes for hver hensikt du har planlagt. De fleste AI-treningsplattformer foreslår å legge til minst 10-15 ytringer per intensjon. Heldigvis lar de fleste utviklingsmiljøer deg legge til ytringer, lage og teste modellen og se på ytringene dine på nytt.

Så den beste praksisen for riktig enhetsutvinning og korrekt intensjonsprediksjon er først å legge til noen få ytringer, teste dem og deretter legge til de andre inngangene.

Testing og gjennomgang i virkelige scenarier

Testing, AI-modellen er avgjørende for at den skal være perfekt. Det er imidlertid best å teste modellen mot ulike grupper mennesker som ikke kan så mye om prosjektet.

Det vil få frem sårbarhetene som vanligvis ikke oppdages av teamet ditt, ettersom teamet ditt har en felles forståelse av AI-modellen du designer.

Utenom det har vi også en kontinuerlig gjennomgang av brukerytringer. Den vil vise frem ytelsen til AI-modeller, og du vil kunne oppdatere modellen med bedre reformer og data.

konklusjonen

Etter hvert er det flere faktorer som bidrar til suksessen til din samtale-AI. Derfor er det best å få modellen trent fra en profesjonell tjeneste som forstår vanskelighetene med prosjektet. Det vil være ditt beste skudd for å trene modellen din for perfeksjon. Du kan kontakt vårt Shaip-team for å diskutere dine krav og lære om prosessen vår.

[Les også: Den komplette guiden til Conversational AI]

Sosial Share