Vergleich von Zeit-Frequenz-Verteilungen zur Audioklassifikation mittels neuronaler Netze
Bachelorarbeit,Masterarbeit,Studienarbeit,Diplomarbeit
Im Rahmen des Projekts Source Localization

Beschreibung

Im Bereich der Audioklassifikation wird vielfach das Spektrogramm, also der Zeit-Frequenz-Verlauf eines Signals, verwendet oder zur Hilfe genommen um Schallsignale zu beurteilen, etwa wenn nur auf Basis einer Audioaufnahme Zahlen erkannt werden sollen. Hierfür wird in den meisten Fällen das Spektrogramm auf Basis der Fouriertransformation berechnet. Diese ist jedoch, auch gefenstert, limitiert in ihrer maximalen Auflösung des Zeit-Frequenz-Verlaufes eines Signals. Es existieren jedoch ganze Klassen weiterer Zeit-Frequenz-Verteilungen, welche mitunter eine höhere Auflösung besitzen als die Fouriertransformation.

In dieser Arbeit sollen verschiedene Zeit-Frequenz-Verteilungen (ZFV) auf dem sogenannten UrbanSound8k Datensatz im Kontext der Audioklassifizierung mittels neuronaler Netze erprobt werden. Hierzu wird ein Standardklassifikator in Python verwendet, welcher zusammen mit den ZFV verwendet werden soll. Nach Untersuchung der individuellen Performance soll dann eine Kombination der ZFV zur Verbesserung der Klassifikation erprobt werden.

Die Arbeit kann auf Deutsch oder auf Englisch geschrieben werden.

Voraussetzungen

- Eigenständiges Arbeiten - Grundlagen Systemtheorie - Grundlagen Python

Ansprechpartner: Reemt Hinrichs