FFT stößt an Grenzen
Die ersten FFT-Messsysteme bedeuteten für die Schallanalyse einen enormen Durchbruch, weil sie die Zusammensetzung eines Klangsignals erstmals in eine sichtbare Form bringen konnten. Dabei zeigen sich Feinheiten, die auch ein sehr gutes Gehör nicht oder nur schwer entdeckt. Doch je länger man damit arbeitet, um so mehr kommt man zu der Erkenntnis, dass die FFT für viele praktische Fälle auch noch nicht das Optimum ist.
Die Grenze ist zunächst einmal prinzipbedingt: Je präziser die Analyse im Frequenzbereich sein soll, um so mehr Abtastwerte muss man in die Rechnung einbeziehen, und um so unpräziser wird sie dann zwangsläufig im Zeitbereich (Bild 1). Will man dagegen eine hohe Zeitauflösung, dann darf man nur wenige Abtastwerte berücksichtigen, woraus eine schlechte Frequenzauflösung resultiert (Bild 2). Was sich der Anwender wünscht – in beiden Bereichen hohe Auflösung – ist mathematisch-physikalisch nicht möglich. Man muss sich jeweils für das eine oder das andere entscheiden. Diese Erscheinung tritt bei allen wellenartigen Vorgängen auf – bis zur Heisenbergschen Unschärferelation in der Quantenphysik, wo Ort und Impuls eines Teilchens nicht gleichzeitig mit beliebiger Präzision bestimmbar sind.
Dazu kommen dann noch weitere Fehler der FFT, die rein technisch bedingt sind und mit den verwendeten Zeitfenstern zusammenhängen. Davon einmal abgesehen, zeigt die FFT, was im Schallsignal physikalisch vorhanden ist. Sie zerlegt das untersuchte Frequenzband in äquidistante Bereiche; jede Linie auf dem Bildschirm repräsentiert also die gleiche absolute Breite. Das zeitliche Auflösungsvermögen – die Reaktionsgeschwindigkeit auf Änderungen – ist dadurch ebenfalls in jedem Frequenzbereich gleich.
Das menschliche Gehör hat aber ganz andere Eigenschaften als ein FFT-Analysator: Bei tieferen Frequenzen (unterhalb von etwa 1 kHz) hat es eine hohe Frequenz-Unterscheidungsfähigkeit, dafür braucht es aber längere Zeit für die Analyse. Bei höheren Frequenzen (oberhalb von etwa 1 kHz) verhält es sich umgekehrt, es trennt weniger scharf und reagiert dafür um so schneller. Grundlegende Forschungsarbeiten auf diesem Gebiet haben Eberhard Zwicker (Psychoakustik, Das Ohr als Nachrichtenempfänger), Ernst Terhardt (gehörangepasste Kurzzeit-Spektralanalyse, Fourier-Zeit-Transformation, FTT), Wolfgang Heinbach (spektrale Konturierung, Teilton-Zeitmuster, TTZM) und Markus Mummert (zeitliche Konturierung) an der TU München durchgeführt.