Ziel der Entwicklung

Logo: Datenaufnahme mit Mikrofonarray zum Training des maschinellen Lernsystems.
Datenaufnahme mit Mikrofonarray zum Training des maschinellen Lernsystems.

Mikrofonarrays zur Lokalisierung und Quantifizierung von Schallquellen an Anlagen und Geräten aller Art sind seit vielen Jahren fester Bestandteil der technischen Akustik und dort mittlerweile in Theorie und Anwendung wohl etabliert.
Bei der praktischen Nutzung von Mikrofonarrays in realen akustischen Szenarien treten jedoch eine Vielzahl von Störeinflüssen auf, die die Qualität und Interpretierbarkeit der Messergebnisse deutlich beeinträchtigen können. Zu diesen Einflüssen gehören etwa Reflexionen an Raumbegrenzungen und Objektoberflächen, frequenzabhängige Absorptionseigenschaften, Beugungs- und Diffusionseffekte an komplexen Strukturen sowie Körperschallweiterleitung und Fremdquellen außerhalb des eigentlichen Messbereichs. Unter idealisierten Laborbedingungen lassen sich einige dieser Effekte mit konventionellen signalverarbeitungstechnischen Verfahren bzw. durch Simulationen teilweise kompensieren.
In realen Messsituationen bleiben jedoch zahlreiche nicht modellierte Artefakte bestehen, die zu Fehlinterpretationen führen können. Dadurch ist es insbesondere für Anwender ohne tiefgehendes Fachwissen in der Arraytechnik schwierig, akustische Karten oder Lokalisierungsergebnisse korrekt zu bewerten. Diese Ausgangssituation verhindert bislang eine deutlich breitere mögliche Nutzung von Arraytechnik, z. B. für automatische Fehlerdetektion und -klassifikation in komplexeren, industriellen Umgebungen oder die einfache Anwendbarkeit durch nicht hochspezialisiertes Personal.
Moderne Verfahren des maschinellen Lernens und der künstlichen Intelligenz besitzen das Potenzial, komplexe akustische Szenarien eigenständig anhand aufgezeichneter Mikrofonarraydaten zu erlernen und zu modellieren.
Das Vorlaufvorhaben „AntiLerM“ verfolgte das Ziel, ein neuartiges, auf Methoden des tiefen Lernens basierendes Modellierungs- und Auswerteverfahren zu entwickeln, das die Beschreibung realitätsnaher akustischer 3D-Szenen ermöglicht. Hierbei sollten sowohl die Schallquellen und ihre Richtcharakteristiken als auch Raumantworten, Kohärenzbeziehungen und verschiedene Störeinflüsse in die Modellbildung einbezogen werden. Das Projekt zielte darauf ab, ein lernfähiges System zu schaffen, das aus simulierten und realen Arraydaten selbstständig die relevanten akustischen Zusammenhänge erkennt und quantifiziert.

Vorteile und Lösungen

Zur Erreichung des Projektzieles wurde eine geschickte Kombination aus klassischen mathematisch-theoretischen Modellansätzen und modernen maschinellen Lernverfahren angewendet. Zur physikalischen Modellierung der Eigenschaften gerichteter Schallquellen wurden auf der Helmholtz-Gleichung beruhende orthogonale Entwicklungen in Kugelflächenfunktionen mit schwingenden Kugelkappen benutzt. Darüber hinaus wurden Raumeinflüsse über Spiegelquellenmodelle sowie Materialeigenschaften über Absorptionskoeffizienten sowie viele weitere geometrische Parameter der akustischen Mess-Szene in 3D wie etwa Arraygeometrien, Messabstände, Objektpositionen, Raumbegrenzungen, Reflexionsflächen, Temperaturen, nichtkorrelierte Störquellen etc. in die Modellbildung einbezogen.
Auf dieser Grundlage wurde im nächsten Schritt als Basis für das umfangreiche Training der ML-Verfahren eine große Anzahl simulativer Datensätze mit verschiedensten Parametrierungen erzeugt. Speziell für die Nutzung mit Mikrofonarrays hat sich der Ansatz als vorteilhaft erwiesen, die Daten der komplexwertigen Kreuzspektralmatrix (Cross Spectral Matrix - CSM) in der Formulierung der Zielfunktion zu verwenden. Somit konnte das maschinelle Lernen mit der Repräsentation sowohl der akustisch gestörten Szenarien als auch der idealen, ungestörten Szene als das vorgegebene Lernziel trainiert werden.
In weiteren Phasen des Projektes wurden die zugehörigen ML-Modelle und Netzstrukturen sowie die zugehörigen Hyperparameter fortlaufend optimiert. Hierfür wurden sowohl umfangreiche Simulationen als auch Realdaten verwendet.
Schließlich konnten die Resultate anhand praktischer Versuchsaufbauten validiert werden und zeigten die grundlegende Tragfähigkeit des gewählten Ansatzes. Im Bild 1 ist ein Versuchsaufbau in der Freifeldmesskabine der TH Wildau gezeigt. Dabei wurden die 3 Schallquellen mit weißem Rauschen in unterschiedlichen Frequenzbändern und mit verschiedenen Pegeln angesteuert. Die Daten wurden mit einem 192-Kanal-Array aufgenommen. Das Bild 2 zeigt die lauteste Emission des rechten Lautsprechers, während die starke Reflexion auf der Tischoberfläche die leisere Quelle des Dodekaeder-Lautsprechers maskiert. Im Bild 3 ist die Ausgabe des ML-Modelles zu sehen. Die Tischreflexionen beider Lautsprecher konnten erfolgreich eliminiert werden. Dadurch wird nun auch die zuvor verdeckte Schallquelle des Dodekaeders sichtbar gemacht.

Zielgruppe und Zielmarkt

Potenzielle Anwender sind alle Nutzer von Arraytechnik, die mit Aufgaben der akustischen Fehlerdetektion und Produktentwicklung und -prüfung in der Praxis befasst sind. Vorteile ergeben sich aus der Möglichkeit, nun auch komplexere, reale akustische Szenarien in gestörten Umgebungen besser und realistischer abzubilden und insbesondere die akustischen Störeinflüsse auch automatisch durch das ML-Modell erlernbar zu machen.
Sinnvolle künftige Anwendungen der Projektergebnisse gibt es insbesondere bei der automatischen akustischen Qualitätsprüfung von Komponenten und Prozessen im industriellen Umfeld, bei End-of-Line-Kontrollen, bei der akustischen Dichtheitsprüfung und Leckagedetektion, in der Raum- und Bauakustik sowie bei der intelligenten Nutzerunterstützung bei sehr komplexen Messabläufen und interaktiven Datenauswertungen.