Abtasttheorem
Für das Abtasttheorem gibt es eine Vielzahl von Darstellungsmöglichkeiten. Im Kern besagt es, daß ein analoges Signal mit einer Abtastrate digitalisiert werden muß, die mindestens doppelt so hoch ist, wie die maximale Frequenz des Eingangssignals. Unter diesen Bedingungen kann das analoge Signal vollständig aus den Abtastwerten rekonstruiert werden.
Schauen wir uns ein Beispiel an. Wir haben einen reine Sinus der Frequenz 18kHz und tasten diesen mit einer Rate von 44100Hz ab. In diesem Bild ist das Original Signal (blau) und die Abtastung (rot) dargestellt.
Im folgenden Bild wurden die Abtastwerte (rot) linear interpoliert (blau).
Betrachtet man die reinen Abtastwerte, so haben diese zunächst wenig Ähnlichkeit mit einem Sinus. Das Signal sieht stark verzerrt aus, trotzdem ist es die korrekte Darstellung des reinen Sinussignals. Aus diese Werte kann das kontinuierliche analoge Signal wieder eindeutig berechnet werden. Allerdings ist die lineare Interpolation nicht nur irreführend, sondern auch falsch.
Dieser Effekt führt bei manchen Audio-Programmen zu Verwirrungen, da beim starken Vergrößeren, optisch kein Sinus mehr erkennbar ist. Bessere Programme bieten daher eine korrekte interpolierte Darstellung, bei dem das Originalsignal erkennbar ist.
Unter Einhaltung des Abtasttheorems kann das Original-Signal immer eindeutig berechnet werden. Diesen Schritt bezeichnet man als Rekonstruktion oder Interpolation.
Diese Eindeutigkeit geht jedoch verloren, wenn das Abtasttheorem nicht eingehalten wurde. Ein mit 44100Hz abgetasteter Sinus mit 26.1kHz ist mit einem abgetasteten 18kHz Signal identisch.
Rekonstruktion
Wie kann aus der diskreten Abtastung der ideale Sinus und jedes andere Signal berechnet werden? Eine einfache lineare Interpolation (manche Programme machen das) reicht nicht wie man oben direkt sieht. Mathematisch korrekt ist eine Sinc-Interpolation. Das benutzt man auch zum Beispiel in Programmen, die die Abtastrate verändern (sample rate conversion). In einem DAC, der aus dem digitalen Signal wieder ein kontinuierliches Signal erzeugt, erfolgt die Interpolation/Rekonstruktion durch einen analogen Tiefpass. Dies ist mathematisch äquivalent zur Sinc-Interpolation.
Übersteuerungen
Nehmen wir an, das digitale Signal hat einen Aussteuerbereich von +/-1.0 . Auf den ersten Blick ist ein digitales Sprungsignal mit der Wertefolge ... 0 0 0 0 +1 +1 +1 +1 ... usw. nicht übersteuert. Die Abtastwerte sind schließlich im Aussteuerbereich. Rekonstruiert man jedoch dieses Signal mit der Sinc-Interpolation, so zeigen sich Überschwinger an den Flanken, die den Aussteuerbereich überschreiten. Das analoge Signal ist also größer als 1.0.
Aufpassen muss man daher, wenn man den Spitzenwert aus einem digitalen Datenstrom berechnet. Der "echte" Spitzenwert kann größer sein als die Abtastwerte.
Dieses Überschwingen an steilen Flanken wird auch als Gibb'sches Phänomen oder "ringing" bezeichnet. Manche Autoren verwenden diese Darstellungen, um dieses scheinbare parasitäre Einschwingen als Hinweis auf eine minderwertige Qualität digitaler Aufnahmen. Dies ist aber Unsinn, da es letztlich nur durch die Bandbegrenzung hervorgerufen wird.
Abtastrate
Nimmt man an, dass ein Mensch sowieso nur bis maximal 20kHz hören kann (Erwachsene typischerweise weit darunter), so scheint eine Abtastrate von 44.1kHz (CD) oder 48kHz ausreichend. In der Praxis ist es jedoch schwierig steilflankige analoge Filter zu entwerfen, die einen Durchlassbeich bis 20kHz haben und bei der halben Abtastfrequenz bereits eine Dämpfung von 120dB um die Spiegelspektren zu unterdrücken. Die Anforderungen sind natürlich wesentlich einfacher zu erfüllen, je höher die Abtastrate ist. Natürlich könnte man Audio dann konsequent mit 192kHz abtasten, die Datenrate erhöht sich dadurch aber erheblich, ohne das wir einen Informationsgewinn haben. Daher vewenden moderne DACs Interpolationstechniken (Oversampling). Das digitale Signal wird digital interpoliert auf ein Vielfaches der originalen Abtastrate und dann erst in ein analoges Signal umgewandelt. Die notwendigen analogen Filter können daher wesentlich flacher sein und haben weniger Einfluss auf das eigentliche Nutzsignal.
High-End Audio Analysatoren wie der APX555 von Audio Precision unterstützen sogar Abtastraten bis 2MHz. Diese hohe Bandbeite ist notwendig, um die hochfrequenten Modulationsreste von digitalen Verstärkern zu erfassen.
Quantisierungsrauschen
Ein einfacher 16Bit ADC hat eine theoretische Dynamik von ca. 96dB. Kein Mensch auf unserem Planeten ist in der Lage bei einem Sinuston bei Vollaussteuerung irgendwelche Quantisierungseffekte zu hören. Daher sollte 16Bit für Audio doch eigentlich genügen?
Oder?
In der Praxis (d.h. Musik und Sprachaufnahmen) tauchen reine Sinustöne bei Vollaussteuerung nicht auf. In leiseren Passagen sind wir häufig weit von der Vollausteuerung entfernt. Da werden Quantisierungseffekte dann doch hörbar insbesondere dadurch, dass der Quantisierungsfehler kein weisses Rauschen ist. In der Tat sind die Quantisierungseffekte sehr nicht-linear und fallen einem geübeten Ohr auf. Daher wurde in den letzten Jahren die Dynamik der ADCs erheblich verbessert. Moderne ADCs erreichen ein THD+N von -120dB. Gelichzeitig versuchte man das die Quantisierungsfehler zu verschleiern. Durch Noise-Shaping und Dithering wurde der Quantisierungsfehler in Frequenzbereiche verschoben, in denen unser Ohr nicht so empfindlich ist. Messtechnisch sind solche ADC sogar etwas schlechter, aber Sie klingen besser.