Reduktion auf Konturen und Tracks
Die weiteren Stufen der auditorischen Analyse bestehen dann darin, die Teile der Information aus dem Bild zu eliminieren, die das menschliche Ohr nicht wahrnimmt. Das erhöht die Klarheit der visuellen Darstellung. Das Ohr bildet aus der Repräsentation des Klanges eine Art Konturierung. VIPER vollzieht diesen Vorgang durch die Extraktion der Maxima im Spektrogramm nach (Bild 6). Dabei lassen sich sowohl Frequenz- wie Zeitkonturen bilden. Die Frequenzkonturen (Bild 7) spüren tonale Komponenten von Klängen wie Vokalen in Sprache auf, die Zeitkonturen plötzliche Komponenten wie Explosivlaute.
Hieraus lassen sich dann so genannte "Tracks" berechnen, die die tonalen Komponenten im Signal nachbilden (Bild 8). Diese verbinden benachbarte Konturelemente, solange deren Frequenzabstände innerhalb eines Bereiches liegen, der in subjektiven Gruppierungs-Experimenten gefunden wurde. Komponenten, die nicht zu Tracks gehören, werden als Rauschen verworfen. So kann die Track-Bildung auch für die Rauschverminderung verwendet werden.
Auf der Basis dieser Analyse lassen sich die Klänge dann am Bildschirm editieren, d. h. gezielt umbauen. Man kann einzelne Bereiche verstärken, abschwächen, verschieben, kopieren, löschen usw. und sich dann den veränderten Klang erneut anhören. Mit flexiblen Zoomfunktionen lassen sich dabei Details herausvergrößern (Bild 9). Aus dem Spektrogramm oder den Konturen ist dann auch eine erneute Resynthese des Klanges möglich. Man kann ihn so lange maßschneidern und verschiedene Versionen miteinander vergleichen, bis das Optimum erreicht ist.
Für spezielle Analysemethoden lassen sich die gewonnenen Daten in das Programm MATLAB exportieren und damit weiterverarbeiten.