Banksjekkdatasett (Document AI)

Bruk sak: OCR
Format: . Jpg
Telle: 2023
merknad: Nei
Beskrivelse: Banksjekkdatasettet (Document AI): Syntetiske banksjekker består av kunstig genererte sjekkebilder designet for å gjenskape utseendet og innholdet til ekte sjekker. Den inkluderer ulike elementer som navn på utbetalingsmottaker, beløp, datoer, signaturer og sjekknumre. Dette datasettet brukes til å trene og evaluere Document AI-systemer i oppgaver som optisk tegngjenkjenning (OCR), sjekkbehandling og automatisert datautvinning, og gir et kontrollert miljø for modellutvikling uten personvernhensyn til ekte sjekker.
Opptakstilstand: - Klikkede bilder - Skannet - Nettskraper
Bankutskriftsdatasett (Document AI)

Bruk sak: OCR
Format: .jpg, png
Telle: 5366
merknad: Nei
Beskrivelse: Bankutskriftsdatasettet (Document AI): Syntetiske kontoutskrifter inkluderer kunstig genererte kontoutskrifter designet for å simulere ekte økonomiske dokumenter. Den har ulike transaksjonsposter, datoer, beløp og kontodetaljer, strukturert for å speile virkelige formater og innhold. Dette datasettet brukes til å trene og evaluere Document AI-systemer i oppgaver som optisk tegngjenkjenning (OCR), datautvinning og dokumentanalyse, og tilbyr et kontrollert miljø uten personvernproblemene til faktiske økonomiske data.
Opptakstilstand: - Skannet - Bankkontoutskrift - Nettskraper
Datasett for kinesiske regninger

Bruk sak: OCR
Format: Bilde
Telle: 6k
merknad: Ja
Beskrivelse: Datasettet for kinesiske regninger inkluderer bilder eller teksteksempler av ulike typer regninger, for eksempel fakturaer, kvitteringer og kontoutskrifter, skrevet på kinesisk. Den har forskjellige formater og innhold, inkludert varebeskrivelser, beløp og datoer. Dette datasettet brukes til oppgaver som optisk tegngjenkjenning (OCR), finansiell dokumentbehandling og automatisert datautvinning.
Dokumenter / OCR – Arabisk og engelsk OCR-innholdsdatasett

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 1,321
merknad: Nei
Beskrivelse: Bildesamling med arabisk og engelsk innhold: Bilde + annotering for OCR
Dokumenter / OCR – Datasett for strekkodevideoer

Bruk sak: Dokumenter / OCR
Format: videoer
Telle: 2,767
merknad: Nei
Beskrivelse: Strekkodevideoer (Code128, UPC/EAN, PDF417, Aztec, Multi-code)
Dokumenter / OCR – Datasett for buet trykt tekst

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 18,986
merknad: Nei
Beskrivelse: Buet trykt tekst: Samle bilder med buet tekst eller tekst med ikke-lineær grunnlinje
Dokumenter / OCR – Finansielle dokumenter (bank, lønnsslipp, skatt, USA)

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 26,446
merknad: Nei
Beskrivelse: Finansielle dokumenter: Kontoutskrift, sjekk, lønnsslipp, skatt, boliglån, forsikringskrav (USA)
Dokumenter / OCR – Finansielle dokumenter (Fase 1 – Boliglån)
Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 9,192
merknad: Nei
Beskrivelse: Finansielle dokumenter (fase 1) Boliglånsdatasett – utskrift, skanning, fotografering
Dokumenter / OCR – Finansielle dokumenter (Fase 2 – Forsikring)

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 7,636
merknad: Nei
Beskrivelse: Finansielle dokumenter (fase 2) Forsikringsdatasett – utskrift, skanning, fotografering
Dokumenter / OCR – Håndskrevet tekstdatasett (JP/KR/RU)

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 106,313
merknad: Nei
Beskrivelse: Håndskrevet tekst: LivePhotos med håndskrevet tekst (japansk, koreansk, russisk)
Dokumenter / OCR – Fakturadatasett med avgrensningsboksannotering

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 87
merknad: Ja
Beskrivelse: Fakturadatasett med markeringsboksannoteringer inkluderer skannede eller digitale fakturaer der viktige felt som fakturanummer, dato, leverandørdetaljer, linjeelementer og totalbeløp er merket med markeringsbokser, slik at AI-modeller nøyaktig kan oppdage og trekke ut strukturert informasjon fra ustrukturerte dokumenter.
Dokumenter / OCR – LivePhotos med trykt tekst (JP/KR/RU)
Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 4,944
merknad: Nei
Beskrivelse: LivePhotos med trykt tekst (japansk, koreansk, russisk)
Dokumenter / OCR – Flerspråklig datasett for kvitteringer/fakturaer

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 8,961
merknad: Nei
Beskrivelse: Flerspråklig datasett for kvitteringer og fakturaer omfatter ulike økonomiske dokumenter på flere språk, noe som gjør det mulig for AI-modeller å trene for tverrspråklig tekstgjenkjenning, uttrekk av viktige felt og dokumentforståelse.
Dokumenter / OCR – Syntetiske bankutskrifter (40 maler)

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 1,290
merknad: Nei
Beskrivelse: Bankutskrifter - Unik mal - 40: Syntetiske bankutskrifter
Dokumenter / OCR – Syntetiske lønnsslipper (60 maler)

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 2,010
merknad: Nei
Beskrivelse: Sjekk - Unik mal - 60: Syntetiske lønnsslipper
Dokumenter / OCR – Syntetiske lønnsslipper (130 maler)

Bruk sak: Dokumenter / OCR
Format: Bilder
Telle: 2,023
merknad: Nei
Beskrivelse: Lønnsslipper - Unik mal - 130: Syntetisk banksjekk
Datasett for lønnsslipp (Document AI)

Bruk sak: OCR
Format: . Jpg
Telle: 2010
merknad: Nei
Beskrivelse: Lønnslippdatasettet (Document AI): Syntetiske lønnsslipper består av bilder av kunstig genererte lønnsslipper uten merknader. Den har ulike lønnsslippformater og detaljer som ansattes navn, lønn og datoer, brukt til opplæring og testing av Document AI-systemer i oppgaver som OCR og dokumentbehandling.
Opptakstilstand: - Skannet - Nettskraper

