Definisjon
Strukturerte data refererer til informasjon organisert i forhåndsdefinerte formater som tabeller, databaser eller regneark. Dette står i kontrast til ustrukturerte data som fritekst eller bilder.
Formål
Formålet er å muliggjøre effektiv lagring, gjenfinning og analyse av informasjon. Strukturerte data ligger til grunn for datavitenskap og AI-systemer.
Viktigheten
- Lett søkbar og maskinlesbar.
- Gir pålitelig innspill for veiledet læring.
- Begrenset i å fange opp kompleks variasjon i den virkelige verden.
- Ofte kombinert med ustrukturerte data for rikere modeller.
Slik fungerer det
- Samle inn data fra sensorer, transaksjoner eller logger.
- Organiser i rader og kolonner med definert skjema.
- Lagre i relasjonsdatabaser eller NoSQL-databaser.
- Spør ved hjelp av SQL eller API-er.
- Bruk som input for analyser eller ML-modeller.
Eksempler (den virkelige verden)
- Banktransaksjoner lagret i strukturerte databaser.
- Sykehusjournaler i strukturerte EHR-formater.
- Produktkataloger for e-handel.
Referanser / Videre lesning
- ISO/IEC 11179: Metadataregistre.
- NIST-rammeverk for stordatainteroperabilitet.
- Kimball & Ross. Verktøysettet for datavarehuset.
- Strukturerte og ustrukturerte data:


