Das klassische Telefonieren hat ausgedient. Künftig werden Unternehmen und Privatleute über das Internet miteinander sprechen. Voice over IP heißt die Technik, bei der digitalisierte Sprache in Form von Datenpaketen übertragen wird.
Hannover - Früher telefonierte man analog. Heute hat die Digitalisierung auch die Telefonie erreicht. In diesem Zusammenhang lautet das wichtigste Stichwort Voice over IP (VoIP). VoIP beschreibt eine Technik, bei der digitalisierte Sprache in Form von Datenpaketen mit Hilfe des Internet Protokolls (IP) übertragen wird.
In diesem Punkt unterscheidet sich VoIP nicht nur von der analogen Technik, sondern auch von der digitalen Festnetztelefonie (ISDN), wo digitalisierte Sprache kontinuierlich mit einer festen Bandbreite über eine reservierte Leitungsverbindung zwischen den Gesprächspartnern übertragen wird.
IP-Pakete werden hingegen individuell über ein vermaschtes Netzwerk übermittelt. Die Datenpakete können sich auf unterschiedlichen Wegen durch das Netzwerk bewegen und konkurrieren mit Paketen anderer Datenanwendungen, weshalb in der Regel eine bevorzugte Weiterleitung von Sprachdaten für eine ausreichende Sprachqualität notwendig ist.
Dabei ist von Vorteil, dass nicht genutzte Bandbreite für andere Anwendungen zur Verfügung steht und keine Leitung für die Dauer des Gesprächs blockiert wird.
Ein kontinuierlicher Datenstrom auf Senderseite wird in einzelne Pakete aufgeteilt, die auf Empfangsseite wieder zusammengesetzt werden.
Damit bei unvorhergesehenen Verzögerungen einzelner Pakete der Datenstrom auf Empfangsseite nicht abreißt und zu Tonstörungen führt, wird dort ein Pufferspeicher eingesetzt. Dieser enthält mehrere Datenpakete auf Vorrat. Für die Dekodierung und Wiedergabe werden die Pakete nacheinander aus dem Pufferspeicher entnommen.
Von Jittern und Delays
Von Jittern und Delays
Durch die Speicherung in einem Puffer können zeitliche Schwankungen, die als Jitter bezeichnet werden, bei der Paketübertragung ausgeglichen werden. Wenn der Jitter die als Zeitdauer definierte Länge des Empfangspuffers übersteigt, kommt es allerdings zur Störung der Sprachwiedergabe.
Bei unkomprimierter Sprachübertragung wirkt sich dies durch Knacken und Aussetzer aus, bei Einsatz von Sprachkompression wird das Sprachsignal verzerrt. Der Effekt ist bekannt und tritt in gleicher Weise auch bei einer schlechten Mobilfunkverbindung auf.
Durch den Einsatz des Pufferspeichers wird jedoch bereits eine Grundverzögerung, ein so genanntes Delay, in den Übertragungsweg eingebracht. Die Einstellung der Länge des Pufferspeichers stellt letztlich einen Kompromiss aus Grundverzögerung und Sprachqualität durch Jitterausgleich dar.
Auch das Delay beeinträchtigt die Sprachqualität, weil bei steigender Verzögerung die Kommunikation mit dem Gesprächspartner erschwert wird - beide fallen sich gegenseitig ins Wort.
Kommt beispielsweise auf eine Frage nicht binnen kurzer Zeit eine Antwort, beginnt der Fragende sein Anliegen zu wiederholen, während die verzögerte Antwort eintrifft.
Die Fragewiederholung wird abgebrochen, trotzdem erreicht dieses Fragment den Befragten, der dann wiederum seine Antwort zu wiederholen beginnt. So dreht sich das Gespräch im Kreis. Die Frage lautet, wie sich die Verzögerungszeit minimieren lässt.
Priorisierung und Sprache
Priorisierungsverfahren und Sprachqualität
In der Vergangenheit wurden Datenübertragungen unterschiedlicher Anwendungen im Netzwerk gleichberechtigt durchgeführt, weil es keine Echtzeitanforderungen gab. Ob eine Dateiübertragung einige Millisekunden mehr oder weniger benötigte, war nicht von Belang.
Sprachdaten, die in Echtzeit übertragen wurden, mussten sich die verfügbare Übertragungsbandbreite mit anderen Daten teilen, wobei durch Delay und Jitter die bereits veranschaulichten Einbußen der Sprachqualität entstanden.
Damit im Netzwerk klare Verhältnisse herrschen, sollten Sprachdaten mit Hilfe von Priorisierungsmaßnahmen bevorzugt transportiert werden.
Zu diesem Zweck gibt es auf IP-Ebene Verfahren, wie Type of Service (ToS) oder Differentiated Services (DiffServ). Auf Ethernet-Ebene gibt es mit dem Standard IEEE 802.1p/Q eine alternative Möglichkeit.
Die Priorisierungsverfahren funktionieren auf dieselbe Art und Weise: Der Datenverkehr wird in unterschiedliche Prioritätsklassen eingeteilt und dann entsprechend behandelt.
Zu Zeiten hoher Auslastung eines Netzwerkknotens müssen Pakete niedrigerer Priorität auf Empfangsseite in Pufferspeichern warten. Sie werden erst versendet, wenn sie an der Reihe sind. Bevorzugter Datenverkehr wird dagegen sofort weitergeleitet.
Im Überlastungsfall laufen diese Datenwarteschlangen über und Pakete müssen verworfen werden. Echtzeitdaten mit hoher Priorität werden allerdings erst dann verworfen, wenn deren Datenverkehr selbst das Netz überlastet.
Transport und Qualität
Transportwege und Sprachqualität
Mit gewissen Einschränkungen funktioniert VoIP aber auch ohne Priorisierung. Solange mit Sicherheit keine Kapazitätsgrenzen bei der Übertragung auftreten, so dass Warteschlangen gefüllt werden müssen, leidet auch die Sprachübertragung nicht.
In der Praxis kann dies leicht bei Nutzung eines DSL-Anschlusses demonstriert werden: Parallel zu einem VoIP-Telefonat am heimischen DSL-Anschluss lassen sich problemlos kleinere, bilderarme Webseiten laden, ohne dass die Sprachqualität beeinträchtigt wird.
Ein Dateidownload mit hoher Bandbreite führt jedoch meist zur Auslastung der verfügbaren Übertragungsbandbreite und bewirkt Verzögerungen bei der Sprachübertragung, die sich meist als Aussetzer bemerkbar machen.
Wenn die bevorzugte Weiterleitung von Sprachpaketen gegeben ist, können sie dennoch sehr unterschiedliche Paketlaufzeiten aufweisen, die durch unterschiedliche Transportwege entstehen.
Ein erhöhter Jitter ist die Folge. Getreu dem Motto "viele Wege führen nach Rom" können Pakete auf unterschiedlichen Wegen zum Empfänger gelangen.
Entsprechende Gegenmaßnahmen haben das Ziel, sicherzustellen, dass alle Pakete eines Gesprächs denselben Weg durch das Netzwerk zurücklegen. Multiprotocol Label Switching (MPLS) ermöglicht beispielsweise in größeren Netzen die gleiche Wegführung für alle Pakete einer Verbindung.
Konkurrierende Standards
Konkurrierende Übertragungsstandards
Um Voice over IP zu nutzen ist der Einsatz von Standards notwendig, um eine weltweite, größtmögliche Kompatibilität zwischen Geräten unterschiedlicher Hersteller zu erreichen. Eine vollständige Kompatibilität ist jedoch kaum möglich, weil Hersteller stets bestrebt sind, eigene proprietäre Features zu implementieren, um sich von den Wettbewerbern abzuheben.
Die wichtigsten Standards werden von der ITU-T (International Telecom Union - Telecommunication) und von der IETF (Internet Engineering Task Force) entwickelt. Die ITU wird von den Länderregierungen der teilnehmenden Staaten unterhalten.
Die IETF ist hingegen eine für jeden offene Gemeinschaft von Experten, die Standards für Internettechnologien entwickelt. Beide Organisationen entwickeln teils konkurrierende Standards, arbeiten aber auch in einigen Bereichen zusammen.
Das H.323-Protokoll
Um Anrufe zu tätigen, ist eine Kommunikation zwischen den Endgeräten im Vorfeld eines Gespräches notwendig. Die Vorabkommunikation wird als Signalisierung bezeichnet. Hierfür hat die ITU den Standard H.323 für paketbasierte Netze entwickelt. Der Standard ist ursprünglich als Derivat zu einem ISDN-Videokonferenzsystem mit der Bezeichnung H.320 entstanden.
H.323 haftet jedoch der Nachteil eines komplexen und starr definierten Multimediasystemkonzepts an. Es ist nicht für flexible Einsätze außerhalb der üblichen Telefonie- und Videokonferenzanwendungen geeignet.
Andererseits kann H.323 auf eine lange Entwicklungsgeschichte zurückblicken und hat einen hohen Reifegrad erreicht, weshalb es für VoIP-Anwendungen durchaus geeignet ist.
Der Markt und das SIP
Der Markt strebt in Richtung SIP
Das Session Initiation Protocol (SIP) der IETF verfolgt dagegen einen Internet-basierten Ansatz. Es lehnt sich an bekannte Internettechnologien wie HTML und E-Mail an und schafft eine nahtlose Integration in die Internet-Protokollarchitektur.
SIP behält sich dabei unterschiedlichste Einsatzszenarien vor und beschränkt sich auf Signalisierungsaufgaben. Deshalb kann SIP gemeinsam mit anderen Protokollen für verschiedene Zwecke eingesetzt werden. Beispielsweise wird es neben Voice over IP auch für Instant-Messaging-Anwendungen eingesetzt.
Inzwischen strebt der Markt in Richtung SIP. Selbst Hersteller und Provider, die in der Vergangenheit auf H.323 gesetzt haben, sind inzwischen auf den SIP-Zug aufgesprungen, um die Marktchance einer breiten Einführung der IP-Telefonie nicht zu verpassen.
SIP hat sich zweifellos gegenüber H.323 durchgesetzt. Trotzdem werden noch für einige Jahre Produkte angeboten werden, die auf H.323 basieren. Diese müssen nicht schlechter sein und können in geschlossenen Unternehmensbereichen bedenkenlos eingesetzt werden. Lediglich im öffentlichen Bereich macht eine Neuanschaffung von H.323-Produkten keinen Sinn mehr, weil fast alle Provider inzwischen ausschließlich SIP einsetzen.
Glücklicherweise ist eine Umsetzung zwischen H.323- und SIP-Systemen möglich, weil beide Verfahren dasselbe Echtzeit-Protokoll für die Sprachübermittlung und dieselben Sprachcodierungen einsetzen. Das Protokoll nennt sich Real Time Protocol (RTP).
Der Einsatz von RTP vereinfacht die Entwicklung von Gateways. Gateways können die Sprache zwischen beiden Systemen übermitteln. Selbst wenn sich mittelfristig keiner der beiden Standards gegen den anderen durchsetzen sollte, ist das nicht problematisch. Denn inzwischen sind auch hybride Systeme auf dem Markt, die sowohl H.323 als auch bei SIP unterstützen.