23.11.2023, 09:15
Guten Morgen,
in diesem Thread, in dem es erstmal nur um eine verbesserte Technik bei der Nahfeldmessung ging, entspann sich eine weitere Diskussion über Lautsprechermessverfahren. Darum soll es hier nicht gehen, aber in dem Zuge erwähnte ich hier und hier, dass die Fouriertransformation nicht der Weisheit letzter Schluss ist.
Diesen Thread lege als Gedankenstütze für mich und als Anregung für andere an, sich mit alternativen Verfahren zu beschäftigen. Weil es mir im Zuge der Abstimmung der Flat White mal wieder ziemlich auf den Zünder geht werde ich die nächsten Wochen, sofern es die Zeit zulässt, mich wieder mehr um diese Verfahren kümmern.
Worum geht es?
Die wichtigste Eigenschaft eines Lautsprechers ist, neben der Optik
, der Frequenzgang. Den kann man auf verschiedene Weisen messen, mit einem Multiton, Rauschen, oder über den Umweg der Impulsantwort. Allen diesen Verfahren ist gemein, dass sie die Fouriertransformation benutzen. Ältere Semester oder besonders interessierte junge werden noch Pegelschreiber kennen, die arbeiteten nicht so, aber es gab auch Spektrum Analysatoren mit Mitlauffiltern oder Filterbänken, das ist im Grund nicht viel anders als eine Fouriertransformation. Bei Lautsprechern hat sich inzwischen die Variante mit der Impulsantwort durchgesetzt, weil sie ermöglicht, die unvermeidlichen Raumreflexionen durch Fenstern auszublenden und daher im Quasi-Freifeld zu messen. Das erste kommerzielle Programm dazu war, man möge mich korrigieren, MLSSA, dem gemeinen Selbstbauer durch die Bildchen in der K&T zu Timmermanns Zeiten* bekannt. Vorher gab es noch ein Verfahren namens "Time Delay Spectrometry", welches mathematisch auch wieder in die gleiche Kerbe schlug. Das Verfahren des Fenstern der Impulsantwort krankt daran, dass es häufig einfach nicht lang genug ist. Eine Fensterlänge von 5 ms ist in Wohnräumen oder Büros schon viel, bei der Flat White hatte ich knapp 2,5 ms in 1,5 m Entfernung. Klar, das lässt sich optimieren indem man den Lautsprecher auf ein Podest stellt, aber 5 ms ist halt so wirklich das Maximum, was ich gesehen habe. 5 ms bedeutet eine Frequenzauflösung von 200 Hz und eine belastbare Aussage über den Frequenzgang ab ca 600 Hz (pi mal Daumen 3x Frequenzauflösung, man kann auch drunter gehen wenn man die Augen zusammenkneift). Meine Idee ist, diese Beschränkung aufzuheben, indem ich mich von der Fouriertransformation löse und andere Wege beschreite.
Was genau ist die Fouriertransformation und warum ist das ein Problem?
Die Fouriertransformation ist eine Verallgemeinerung der Fourierreihenentwicklung. Letztere ermöglicht es, periodische Signale, zum Beispiel eine Rechteckschwingung, durch Sinus- und Kosinusschwingungen mit diskreter Frequenz und jeweiligem Pegeln zu beschreiben. Dabei gibt es das sogenannte Gibbsche Phänomen (auch im Artikel beschrieben bzw. verlinkt), welches bei endlichen Fourierreihen dafür sorgt, dass es an scharfen Übergängen - beim Rechteck die beiden Flanken - zu Überschwingern kommt. Je länger die Fourierreihe, also je mehr Sinus-/Kosinusschwingungen verwendet werden, umso geringer wird das Phänomen, bis es bei einer unendlich langen Reihe verschwindet. Das ist dann auch schon der Übergang zur Fouriertransformation mit der Ergänzung, dass die auch nicht mehr diskrete Frequenzen benötigt (was dann im zeitdiskreten Bereich bei der diskreten Fouriertransformation wieder zwangsweise eingeführt wird). Das hat zur Folge, dass die untersuchten Signal auch eine unendlich lange Periode haben dürfen, und das trifft auf eine Impulsantwort zu, das ist im Grunde die Definition.
Die kritischen Schlüsselwörter habe ich schon markiert, periodisch und unendlich. Wenn man eine Impulsantwort durch ein Fenster beschneidet, dann ist sie nicht mehr unendlich lang bzw. wird dann, in der zeitdiskreten Welt (DFT), scheinbar periodisch fortgesetzt. Der Zusammenhang zwischen Zeitbereich (Signal) und Bildbereich (Spektrum) ist immer noch eindeutig durch die Transformation gegeben, aber das Ergebnis ist nicht korrekt, weil ja keine unendlich lange Impulsantwort mehr vorliegt. Schlimmer noch, durch die periodische Fortsetzung in der zeitdiskreten Welt reduziert sich das ansonsten tolle Instrument wieder zurück zur einfachen Fourierreihe.
Wie kann man das verbessern?
Auftritt Laplace-Transformation. Es ist eigentlich nicht korrekt, aber ich betrachte die Laplace-Transformation gerne als Erweiterung der Fouriertransformation. Sie ändert zwei Dinge:
1) sie führt eine komplexe Frequenz ein, das heißt statt einer reinen Sinus-/Kosinunsschwingung kommt eine komplexe Frequenz zum Einsatz (in Mathematisch: f(s)=e^st, s=a+j*w, j=Wurzel(-1), bei der Fouriertransformation ist a=0)
2) sie ist ab t=0 definiert, im Gegensatz zur Fouriertransformation , die von -unendlich bis +unendlich definiert ist.
Komplexe Frequenz bedeutet, dass die Schwingungen entweder exponentiell gedämpft sind oder exponentiell ansteigen können. Gerade letzteres ist mir der Fouriertransformation nicht zu handhaben, das kann sie nicht.
Die Laplacetransformation erlaubt es außerdem, Filter - eigentlich Differentialgleichungen - in Form von Übertragungsfunktionen darzustellen. Die Fouriertransformation kann das nicht, obwohl häufig genug der durch die Fouriertransformation erzeugte Frequenzgang auch Übertragungsfunktion genannt wird (ich bekenne mich schuldig). Das ist meistens kein Problem, aber nicht korrekt.
Der große Nachteil der Laplace- gegenüber der Fouriertransformation ist, dass es keine schnelle Variante als FFT gibt. Also muss man einen anderen Weg gehen.
So eine Übertragungsfunktion eines Filters hat die allgemeine Form:
G(s)=(b0+b1*s+b2*s²+...)/(a0*a1*s+a2*s²+...)
Die Zähler- und Nennerpolynome lassen sich auch als Produkt ihrer (komplexen) Nullstellen beschreiben, eine Nullstelle im Nenner bedeutet, dass die Funktion da sehr groß werden kann (1 geteilt durch 0) und daher nennt man die Nullstellen des Nennerpolynoms Polstellen. Diese Darstellung erlaubt auch die Stabilitätsanalyse einer solchen Übertragungsfunktion, aber das ist hier nicht notwendig. Man kann die Übertragungsfunktion auch als Produkt von Teilübertragungsfunktionen darstellen, das wird bei IIR-Filter häufig angewendet, die meistens als sogenanntes Biquad vorliegen, welches eine Funktion 2. Ordnung sind, also
G(s)=(b0+b1*s+b2*s²)/(a0*a1*s+a2*s²) (<- Unterschied zu oben: das letzte + und die Punkte fehlen)
Ein Lautsprecher lässt sich durch Differentialgleichungen beschreiben, und daher hat er auch so eine Übertragungsfunktion. Ein normaler Tieftöner im geschlossene Gehäuse und unendlicher Schallwand ist zum Beispiel ein Hochpass 2. Ordnung
G1(s)=b12*s²/(a10+a11*s+a12*s²)
dazu kommt dann - vereinfacht - ein Tiefpass 2. Ordnung ab seiner Membranresonanz
G2(s)=b20/(a20+a21*s+a22*s²)
und dann noch ein Tiefpass 1. Ordnung wegen seiner Induktivität
G3(s)=b30/(a30+a30*s)
Die Gesamtübertragungsfunktion lautet also
G(s)*G1(s)*G2(s)*G3(s)
Ich schreibe die hier nicht auf, ist mir zu anstrengend.
Der entscheidende Punkt ist: das gesamte Chassis lässt sich durch 11 Parameter beschreiben, wenn es in einer Schallwand ist kommen nochmal 6 dazu (ein "Biquad", reicht erstmal), in Bassreflex nochmal 2. Also insgesamt 19. Vielleicht, durch irgendwelche Resonanzen, braucht man nochmal ein "Biquad" (+6), schon gelangt man zu 25 Parametern.
Die Idee ist jetzt:
1) man nimmt die gefensterte Impulsantwort
2) man definiert eine Übertragungsfunktion (mit ausreichend Parametern)
3) man passt die Parameter so lange an, bis die Impulsantwort des "Filters" der gefensterten Impulsantwort entspricht (genauer: man minimiert den quadratischen Fehler)
4) man lässt das "Filter" frei laufen und erhält eine unendliche Impulsantwort - allerdings ohne die Reflexionen! - und die wiederum kann man dann mit Hilfe der Fouriertransformation in einen Frequenzgang überführen.
Rein theoretisch müsste es dadurch möglich sein, eine echte Quasi-Freifeld-Messung zu erhalten. Rein praktisch ist es so, dass ich jetzt zwei Verfahren zum Lösen ausprobiert habe - Prony-Methode und eine nicht-lineare Optimierung mit Nelder-Mead - und beide noch nicht so funktionieren wie gehofft. Die Prony-Methode nähert sich manchmal schon ganz gut an, aber teilweise kommt totaler Blödsinn bei heraus, und Nelder-Mead läuft von der Lösung lieber davon als auf sie zu
Aber ich arbeite dran, und das Ziel ist es eben, knapp 50 Jahre Lautsprechermesstechnik jetzt endliche mal auf den Müllhaufen der Geschichte zu werfen.
* Ich weiß nicht, wann die nach ihm umgestellt haben, und ob er die immer noch für die HH benutzt
in diesem Thread, in dem es erstmal nur um eine verbesserte Technik bei der Nahfeldmessung ging, entspann sich eine weitere Diskussion über Lautsprechermessverfahren. Darum soll es hier nicht gehen, aber in dem Zuge erwähnte ich hier und hier, dass die Fouriertransformation nicht der Weisheit letzter Schluss ist.
Diesen Thread lege als Gedankenstütze für mich und als Anregung für andere an, sich mit alternativen Verfahren zu beschäftigen. Weil es mir im Zuge der Abstimmung der Flat White mal wieder ziemlich auf den Zünder geht werde ich die nächsten Wochen, sofern es die Zeit zulässt, mich wieder mehr um diese Verfahren kümmern.
Worum geht es?
Die wichtigste Eigenschaft eines Lautsprechers ist, neben der Optik
, der Frequenzgang. Den kann man auf verschiedene Weisen messen, mit einem Multiton, Rauschen, oder über den Umweg der Impulsantwort. Allen diesen Verfahren ist gemein, dass sie die Fouriertransformation benutzen. Ältere Semester oder besonders interessierte junge werden noch Pegelschreiber kennen, die arbeiteten nicht so, aber es gab auch Spektrum Analysatoren mit Mitlauffiltern oder Filterbänken, das ist im Grund nicht viel anders als eine Fouriertransformation. Bei Lautsprechern hat sich inzwischen die Variante mit der Impulsantwort durchgesetzt, weil sie ermöglicht, die unvermeidlichen Raumreflexionen durch Fenstern auszublenden und daher im Quasi-Freifeld zu messen. Das erste kommerzielle Programm dazu war, man möge mich korrigieren, MLSSA, dem gemeinen Selbstbauer durch die Bildchen in der K&T zu Timmermanns Zeiten* bekannt. Vorher gab es noch ein Verfahren namens "Time Delay Spectrometry", welches mathematisch auch wieder in die gleiche Kerbe schlug. Das Verfahren des Fenstern der Impulsantwort krankt daran, dass es häufig einfach nicht lang genug ist. Eine Fensterlänge von 5 ms ist in Wohnräumen oder Büros schon viel, bei der Flat White hatte ich knapp 2,5 ms in 1,5 m Entfernung. Klar, das lässt sich optimieren indem man den Lautsprecher auf ein Podest stellt, aber 5 ms ist halt so wirklich das Maximum, was ich gesehen habe. 5 ms bedeutet eine Frequenzauflösung von 200 Hz und eine belastbare Aussage über den Frequenzgang ab ca 600 Hz (pi mal Daumen 3x Frequenzauflösung, man kann auch drunter gehen wenn man die Augen zusammenkneift). Meine Idee ist, diese Beschränkung aufzuheben, indem ich mich von der Fouriertransformation löse und andere Wege beschreite. Was genau ist die Fouriertransformation und warum ist das ein Problem?
Die Fouriertransformation ist eine Verallgemeinerung der Fourierreihenentwicklung. Letztere ermöglicht es, periodische Signale, zum Beispiel eine Rechteckschwingung, durch Sinus- und Kosinusschwingungen mit diskreter Frequenz und jeweiligem Pegeln zu beschreiben. Dabei gibt es das sogenannte Gibbsche Phänomen (auch im Artikel beschrieben bzw. verlinkt), welches bei endlichen Fourierreihen dafür sorgt, dass es an scharfen Übergängen - beim Rechteck die beiden Flanken - zu Überschwingern kommt. Je länger die Fourierreihe, also je mehr Sinus-/Kosinusschwingungen verwendet werden, umso geringer wird das Phänomen, bis es bei einer unendlich langen Reihe verschwindet. Das ist dann auch schon der Übergang zur Fouriertransformation mit der Ergänzung, dass die auch nicht mehr diskrete Frequenzen benötigt (was dann im zeitdiskreten Bereich bei der diskreten Fouriertransformation wieder zwangsweise eingeführt wird). Das hat zur Folge, dass die untersuchten Signal auch eine unendlich lange Periode haben dürfen, und das trifft auf eine Impulsantwort zu, das ist im Grunde die Definition.
Die kritischen Schlüsselwörter habe ich schon markiert, periodisch und unendlich. Wenn man eine Impulsantwort durch ein Fenster beschneidet, dann ist sie nicht mehr unendlich lang bzw. wird dann, in der zeitdiskreten Welt (DFT), scheinbar periodisch fortgesetzt. Der Zusammenhang zwischen Zeitbereich (Signal) und Bildbereich (Spektrum) ist immer noch eindeutig durch die Transformation gegeben, aber das Ergebnis ist nicht korrekt, weil ja keine unendlich lange Impulsantwort mehr vorliegt. Schlimmer noch, durch die periodische Fortsetzung in der zeitdiskreten Welt reduziert sich das ansonsten tolle Instrument wieder zurück zur einfachen Fourierreihe.
Wie kann man das verbessern?
Auftritt Laplace-Transformation. Es ist eigentlich nicht korrekt, aber ich betrachte die Laplace-Transformation gerne als Erweiterung der Fouriertransformation. Sie ändert zwei Dinge:
1) sie führt eine komplexe Frequenz ein, das heißt statt einer reinen Sinus-/Kosinunsschwingung kommt eine komplexe Frequenz zum Einsatz (in Mathematisch: f(s)=e^st, s=a+j*w, j=Wurzel(-1), bei der Fouriertransformation ist a=0)
2) sie ist ab t=0 definiert, im Gegensatz zur Fouriertransformation , die von -unendlich bis +unendlich definiert ist.
Komplexe Frequenz bedeutet, dass die Schwingungen entweder exponentiell gedämpft sind oder exponentiell ansteigen können. Gerade letzteres ist mir der Fouriertransformation nicht zu handhaben, das kann sie nicht.
Die Laplacetransformation erlaubt es außerdem, Filter - eigentlich Differentialgleichungen - in Form von Übertragungsfunktionen darzustellen. Die Fouriertransformation kann das nicht, obwohl häufig genug der durch die Fouriertransformation erzeugte Frequenzgang auch Übertragungsfunktion genannt wird (ich bekenne mich schuldig). Das ist meistens kein Problem, aber nicht korrekt.
Der große Nachteil der Laplace- gegenüber der Fouriertransformation ist, dass es keine schnelle Variante als FFT gibt. Also muss man einen anderen Weg gehen.
So eine Übertragungsfunktion eines Filters hat die allgemeine Form:
G(s)=(b0+b1*s+b2*s²+...)/(a0*a1*s+a2*s²+...)
Die Zähler- und Nennerpolynome lassen sich auch als Produkt ihrer (komplexen) Nullstellen beschreiben, eine Nullstelle im Nenner bedeutet, dass die Funktion da sehr groß werden kann (1 geteilt durch 0) und daher nennt man die Nullstellen des Nennerpolynoms Polstellen. Diese Darstellung erlaubt auch die Stabilitätsanalyse einer solchen Übertragungsfunktion, aber das ist hier nicht notwendig. Man kann die Übertragungsfunktion auch als Produkt von Teilübertragungsfunktionen darstellen, das wird bei IIR-Filter häufig angewendet, die meistens als sogenanntes Biquad vorliegen, welches eine Funktion 2. Ordnung sind, also
G(s)=(b0+b1*s+b2*s²)/(a0*a1*s+a2*s²) (<- Unterschied zu oben: das letzte + und die Punkte fehlen)
Ein Lautsprecher lässt sich durch Differentialgleichungen beschreiben, und daher hat er auch so eine Übertragungsfunktion. Ein normaler Tieftöner im geschlossene Gehäuse und unendlicher Schallwand ist zum Beispiel ein Hochpass 2. Ordnung
G1(s)=b12*s²/(a10+a11*s+a12*s²)
dazu kommt dann - vereinfacht - ein Tiefpass 2. Ordnung ab seiner Membranresonanz
G2(s)=b20/(a20+a21*s+a22*s²)
und dann noch ein Tiefpass 1. Ordnung wegen seiner Induktivität
G3(s)=b30/(a30+a30*s)
Die Gesamtübertragungsfunktion lautet also
G(s)*G1(s)*G2(s)*G3(s)
Ich schreibe die hier nicht auf, ist mir zu anstrengend.
Der entscheidende Punkt ist: das gesamte Chassis lässt sich durch 11 Parameter beschreiben, wenn es in einer Schallwand ist kommen nochmal 6 dazu (ein "Biquad", reicht erstmal), in Bassreflex nochmal 2. Also insgesamt 19. Vielleicht, durch irgendwelche Resonanzen, braucht man nochmal ein "Biquad" (+6), schon gelangt man zu 25 Parametern.
Die Idee ist jetzt:
1) man nimmt die gefensterte Impulsantwort
2) man definiert eine Übertragungsfunktion (mit ausreichend Parametern)
3) man passt die Parameter so lange an, bis die Impulsantwort des "Filters" der gefensterten Impulsantwort entspricht (genauer: man minimiert den quadratischen Fehler)
4) man lässt das "Filter" frei laufen und erhält eine unendliche Impulsantwort - allerdings ohne die Reflexionen! - und die wiederum kann man dann mit Hilfe der Fouriertransformation in einen Frequenzgang überführen.
Rein theoretisch müsste es dadurch möglich sein, eine echte Quasi-Freifeld-Messung zu erhalten. Rein praktisch ist es so, dass ich jetzt zwei Verfahren zum Lösen ausprobiert habe - Prony-Methode und eine nicht-lineare Optimierung mit Nelder-Mead - und beide noch nicht so funktionieren wie gehofft. Die Prony-Methode nähert sich manchmal schon ganz gut an, aber teilweise kommt totaler Blödsinn bei heraus, und Nelder-Mead läuft von der Lösung lieber davon als auf sie zu

Aber ich arbeite dran, und das Ziel ist es eben, knapp 50 Jahre Lautsprechermesstechnik jetzt endliche mal auf den Müllhaufen der Geschichte zu werfen.
* Ich weiß nicht, wann die nach ihm umgestellt haben, und ob er die immer noch für die HH benutzt
Molto importante: Auslenkungs- und Leistungsbedarf von Chassis



Jep, und da kommen dann die ganzen zeitdiskreten Phänomäne ins Spiel... Signaltheorie mach schon Spass...