Definisjon
Lydklassifisering er prosessen med å tilordne etiketter til lydopptak basert på innholdet. Kategorier kan omfatte tale, musikk, dyrelyder, alarmer eller miljøstøy.
Formål
Hensikten er å automatisere gjenkjenning og kategorisering av lyd, slik at lyd blir søkbar og analyserbar av AI. Det er mye brukt i sikkerhetssystemer, medieorganisering og hjelpeteknologier.
Viktigheten
- Muliggjør automatisering i tale-, musikk- og lydgjenkjenning.
- Forbedrer tilgjengeligheten gjennom lydbaserte grensesnitt.
- Avhenger av ulike treningsdata for nøyaktighet på tvers av forhold.
- Feil kan påvirke sikkerhetskritiske applikasjoner (f.eks. alarmer).
Slik fungerer det
- Ta opp eller importer rå lydsignaler.
- Ekstraher funksjoner som spektrogrammer eller MFCC-er.
- Trene klassifikatorer (f.eks. nevrale nettverk) på merkede data.
- Evaluer nøyaktigheten mot testsett.
- Distribuer modeller for klassifisering i sanntid eller batch.
Eksempler (den virkelige verden)
- Shazam: identifiserer musikkspor fra korte lydklipp.
- Google Sound Classifier: oppdager hverdagslyder som bjeffing eller sirener.
- BirdNET: identifiserer fuglearter basert på innspilte sanger og rop.
Referanser / Videre lesning
- Lydklassifisering med maskinlæring — TensorFlow.
- Klassifisering av miljøstøy med CNN-er — IEEE (Piczak, 2015).
- Maskinlæring for lydsignalbehandling — MIT OpenCourseWare.


