Arbeiten mit akustischer Echounterdrückung Teil 4 (IOT) | von Monodeep Mukherjee | Juni 2023

0
26


  1. Tiefes Modell mit integrierter Kreuzaufmerksamkeitsausrichtung zur akustischen Echounterdrückung (arXiv)

Autor: Evgenii Indenbom, Nicolae-Cătălin Ristea, Ando Saabas, Tanel Pärnamaa, Jegor Gužvin

Zusammenfassung: Mit den jüngsten Forschungsfortschritten sind Deep-Studying-Modelle zu einer attraktiven Wahl für die akustische Echounterdrückung (AEC) in Echtzeit-Telekonferenzanwendungen geworden. Da akustisches Echo eine der Hauptursachen für schlechte Audioqualität ist, wurde eine Vielzahl von Tiefenmodellen vorgeschlagen. Eine wichtige, aber oft vernachlässigte Voraussetzung für eine gute Qualität der Echounterdrückung ist jedoch die Synchronisierung des Mikrofons und der Signale der Gegenseite. Das Ausrichtungsmodul wird typischerweise mithilfe klassischer, auf Kreuzkorrelation basierender Algorithmen implementiert und ist ein separater Funktionsblock mit bekannten Designeinschränkungen. In unserer Arbeit schlagen wir eine Deep-Studying-Architektur mit integrierter auf Selbstaufmerksamkeit basierender Ausrichtung vor, die in der Lage ist, nicht ausgerichtete Eingaben zu verarbeiten, die Echounterdrückungsleistung zu verbessern und gleichzeitig die Kommunikationspipeline zu vereinfachen. Darüber hinaus zeigen wir, dass unser Ansatz bei schwierigen Verzögerungsschätzungsfällen bei realen Aufzeichnungen aus dem AEC Problem-Datensatz erhebliche Verbesserungen erzielt

2.LCSM: Ein leichtes komplexes Spektralkartierungs-Framework für die stereophone akustische Echounterdrückung (arXiv)

Autor: Chenggang Zhang, Jinjiang Liu, Xueliang Zhang

Zusammenfassung: Die traditionellen adaptiven Algorithmen werden beim Umgang mit stereophoner akustischer Echounterdrückung (SAEC) mit dem Drawback der Nichteindeutigkeit konfrontiert sein. In diesem Artikel schlagen wir zunächst ein effizientes Multi-Enter- und Multi-Output-Schema (MIMO) vor, das auf Deep Studying basiert, um Echos aus allen Mikrofonsignalen gleichzeitig herauszufiltern. Anschließend verwenden wir ein leichtes Advanced Spectral Mapping Framework (LCSM) für Finish-to-Finish-SAEC ohne Dekorrelationsvorverarbeitung für die Lautsprechersignale. In-Place-Faltung und kanalweise räumliche Modellierung werden verwendet, um sicherzustellen, dass die Signalinformationen des nahen Endes erhalten bleiben. Schließlich wurde eine domänenübergreifende Verlustfunktion für eine bessere Generalisierungsfähigkeit entwickelt. Experimente werden unter verschiedenen untrainierten Bedingungen ausgewertet und die Ergebnisse zeigen, dass das LCSM frühere Methoden deutlich übertrifft. Darüber hinaus verfügt der vorgeschlagene Kausalrahmen nur über 0,55 Millionen Parameter, viel weniger als die ähnlichen Deep-Studying-basierten Methoden, was für Geräte mit begrenzten Ressourcen wichtig ist.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here