Banksjekkdatasett (Document AI)

Banksjekkdatasett (Document AI)

Bruk sak: OCR

Format: . Jpg

Telle: 2023

merknad: Nei

X

Beskrivelse: Banksjekkdatasettet (Document AI): Syntetiske banksjekker består av kunstig genererte sjekkebilder designet for å gjenskape utseendet og innholdet til ekte sjekker. Den inkluderer ulike elementer som navn på utbetalingsmottaker, beløp, datoer, signaturer og sjekknumre. Dette datasettet brukes til å trene og evaluere Document AI-systemer i oppgaver som optisk tegngjenkjenning (OCR), sjekkbehandling og automatisert datautvinning, og gir et kontrollert miljø for modellutvikling uten personvernhensyn til ekte sjekker.

Opptakstilstand: - Klikkede bilder - Skannet - Nettskraper

Bankutskriftsdatasett (Document AI)

Bankutskriftsdatasett (Document AI)

Bruk sak: OCR

Format: .jpg, png

Telle: 5366

merknad: Nei

X

Beskrivelse: Bankutskriftsdatasettet (Document AI): Syntetiske kontoutskrifter inkluderer kunstig genererte kontoutskrifter designet for å simulere ekte økonomiske dokumenter. Den har ulike transaksjonsposter, datoer, beløp og kontodetaljer, strukturert for å speile virkelige formater og innhold. Dette datasettet brukes til å trene og evaluere Document AI-systemer i oppgaver som optisk tegngjenkjenning (OCR), datautvinning og dokumentanalyse, og tilbyr et kontrollert miljø uten personvernproblemene til faktiske økonomiske data.

Opptakstilstand: - Skannet - Bankkontoutskrift - Nettskraper

Datasett for kinesiske regninger

Datasett for kinesiske regninger

Bruk sak: OCR

Format: Bilde

Telle: 6k

merknad: Ja

X

Beskrivelse: Datasettet for kinesiske regninger inkluderer bilder eller teksteksempler av ulike typer regninger, for eksempel fakturaer, kvitteringer og kontoutskrifter, skrevet på kinesisk. Den har forskjellige formater og innhold, inkludert varebeskrivelser, beløp og datoer. Dette datasettet brukes til oppgaver som optisk tegngjenkjenning (OCR), finansiell dokumentbehandling og automatisert datautvinning.

Dokumenter / OCR – Arabisk og engelsk OCR-innholdsdatasett

Dokumenter / OCR – Arabisk og engelsk OCR-innholdsdatasett

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 1,321

merknad: Nei

X

Beskrivelse: Bildesamling med arabisk og engelsk innhold: Bilde + annotering for OCR

Dokumenter / OCR – Datasett for strekkodevideoer

Dokumenter / OCR – Datasett for strekkodevideoer

Bruk sak: Dokumenter / OCR

Format: videoer

Telle: 2,767

merknad: Nei

X

Beskrivelse: Strekkodevideoer (Code128, UPC/EAN, PDF417, Aztec, Multi-code)

Dokumenter / OCR – Datasett for buet trykt tekst

Dokumenter / OCR – Datasett for buet trykt tekst

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 18,986

merknad: Nei

X

Beskrivelse: Buet trykt tekst: Samle bilder med buet tekst eller tekst med ikke-lineær grunnlinje

Dokumenter / OCR – Finansielle dokumenter (bank, lønnsslipp, skatt, USA)

Dokumenter / OCR – Finansielle dokumenter (bank, lønnsslipp, skatt, USA)

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 26,446

merknad: Nei

X

Beskrivelse: Finansielle dokumenter: Kontoutskrift, sjekk, lønnsslipp, skatt, boliglån, forsikringskrav (USA)

Dokumenter / OCR – Finansielle dokumenter (Fase 1 – Boliglån)

Dokumenter / OCR – Finansielle dokumenter (Fase 1 – Boliglån)

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 9,192

merknad: Nei

X

Beskrivelse: Finansielle dokumenter (fase 1) Boliglånsdatasett – utskrift, skanning, fotografering

Dokumenter / OCR – Finansielle dokumenter (Fase 2 – Forsikring)

Dokumenter / OCR – Finansielle dokumenter (Fase 2 – Forsikring)

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 7,636

merknad: Nei

X

Beskrivelse: Finansielle dokumenter (fase 2) Forsikringsdatasett – utskrift, skanning, fotografering

Dokumenter / OCR – Håndskrevet tekstdatasett (JP/KR/RU)

Dokumenter / OCR – Håndskrevet tekstdatasett (JP/KR/RU)

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 106,313

merknad: Nei

X

Beskrivelse: Håndskrevet tekst: LivePhotos med håndskrevet tekst (japansk, koreansk, russisk)

Dokumenter / OCR – Fakturadatasett med avgrensningsboksannotering

Dokumenter / OCR – Fakturadatasett med avgrensningsboksannotering

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 87

merknad: Ja

X

Beskrivelse: Fakturadatasett med markeringsboksannoteringer inkluderer skannede eller digitale fakturaer der viktige felt som fakturanummer, dato, leverandørdetaljer, linjeelementer og totalbeløp er merket med markeringsbokser, slik at AI-modeller nøyaktig kan oppdage og trekke ut strukturert informasjon fra ustrukturerte dokumenter.

Dokumenter / OCR – LivePhotos med trykt tekst (JP/KR/RU)

Dokumenter / OCR – LivePhotos med trykt tekst (JP/KR/RU)

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 4,944

merknad: Nei

X

Beskrivelse: LivePhotos med trykt tekst (japansk, koreansk, russisk)

Dokumenter / OCR – Flerspråklig datasett for kvitteringer/fakturaer

Dokumenter / OCR – Flerspråklig datasett for kvitteringer/fakturaer

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 8,961

merknad: Nei

X

Beskrivelse: Flerspråklig datasett for kvitteringer og fakturaer omfatter ulike økonomiske dokumenter på flere språk, noe som gjør det mulig for AI-modeller å trene for tverrspråklig tekstgjenkjenning, uttrekk av viktige felt og dokumentforståelse.

Dokumenter / OCR – Syntetiske bankutskrifter (40 maler)

Dokumenter / OCR – Syntetiske bankutskrifter (40 maler)

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 1,290

merknad: Nei

X

Beskrivelse: Bankutskrifter - Unik mal - 40: Syntetiske bankutskrifter

Dokumenter / OCR – Syntetiske lønnsslipper (60 maler)

Dokumenter / OCR – Syntetiske lønnsslipper (60 maler)

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 2,010

merknad: Nei

X

Beskrivelse: Sjekk - Unik mal - 60: Syntetiske lønnsslipper

Dokumenter / OCR – Syntetiske lønnsslipper (130 maler)

Dokumenter / OCR – Syntetiske lønnsslipper (130 maler)

Bruk sak: Dokumenter / OCR

Format: Bilder

Telle: 2,023

merknad: Nei

X

Beskrivelse: Lønnsslipper - Unik mal - 130: Syntetisk banksjekk

Datasett for lønnsslipp (Document AI)

Datasett for lønnsslipp (Document AI)

Bruk sak: OCR

Format: . Jpg

Telle: 2010

merknad: Nei

X

Beskrivelse: Lønnslippdatasettet (Document AI): Syntetiske lønnsslipper består av bilder av kunstig genererte lønnsslipper uten merknader. Den har ulike lønnsslippformater og detaljer som ansattes navn, lønn og datoer, brukt til opplæring og testing av Document AI-systemer i oppgaver som OCR og dokumentbehandling.

Opptakstilstand: - Skannet - Nettskraper