Wozu Protokolle - Struktur des Internet

Unter einem Protokoll versteht man in diesem Zusammenhang einen Standard über Daten, die in einem Netzwerk ausgetauscht werden sollen. Dieser Standard regelt sowohl den Aufbau des Datenpakets, das verschickt werden soll, als auch den Befehlssatz, welcher auf die Daten angewendet werden kann.

Um die Bedeutung von Protokollen im Internet zu verstehen, muss man zuerst den Aufbau des Internet kennen. Es handelt sich - wie schon im Modul Struktur des Internet erklärt - um einen Zusammenschluss von lokalen Teilnetzen.

Als "Endknoten" in diesem Netzwerk kommen eine Reihe von unterschiedlichen Geräten mit unterschiedlichen Betriebssystemen in Frage: PC (Windows, Unix), Mac, Handhelds (Palm o.ä.), Mobiltelefone, uws. Damit derart heterogene (d.h. unterschidliche) Knoten in einem Netzwerk erfolgreich miteinander kommunizieren können, müssen gewisse Vereinbarungen über Standards getroffen werden. Da das Internet ein heterogenes, offenes und rasant wachsendes Netzwerk ist, hat sich folgende Methode entwickelt, solche Standards festzulegen:

Internet-Standards entstehen in der Regel durch eine lange und öffentliche Diskussion. Dazu stehen formale Verfahren zur Verfügung, die eine Beteiligung durch jeden Interessierten ermöglichen. Zentraler Begriff bei der Entstehung von Standards ist RFC, das bedeutet "request for comments". Ein Vorschlag wird ins Netz gestellt, öffentlich diskutiert, und schließlich zur Abstimmung gestellt. Einige (wenige) dieser so verabschiedeten Standards werden von Gremien zu "Internet-Standards" erhoben. In solchen Standards werden zentrale Internet-Protokolle beschrieben: So entspricht z. B. das File Transfer Protocol (FTP) - zur Übertragung von Dateien im Internet - dem Standard STD0009, aktuell beschrieben im RFC0959.

TCP/IP und Referenzmodelle

Internet-Protokolle bauen auf eine Beschreibung der Kommunikation zwischen Netzwerk-Stationen auf, die in Schichten - von Hardware über Netzwerk bis zu den Anwendungen - gegliedert ist. Ein umfassendes Modell zu diesem Konzept ist das ISO/OSI-Referenzmodell, das die Kommunikation zwischen Stationen in einem Netzwerk in sieben Schichten beschreibt. Übertragen auf das TCP/IP-Protokoll kann das Referenzmodell auf vier Schichten zusammengefasst werden:

Internet-Protokolle je Schicht
Physische Schichten (Hardware)
Internet-Schicht

Das Internet Protokoll (Internet Protocol - IP) stellt die Basisdienste für die Übermittlung von Daten in TCP/IP-Netzen bereit. Hauptaufgaben des Internet Protokolls sind die Adressierung von Hosts und das Fragmentieren von Paketen.

Das Internet Control Message Protocol (ICMP) ist fester Bestandteil jeder IP-Implementierung und dient zur Übertragung von Diagnose- und Fehlerinformationen für das Internet Protocol.

Transport-Schicht

Das Transmission Control Protocol (TCP) ist ein zuverlässiges, verbindungsorientiertes, Bytestrom Protokoll. Die Hauptaufgabe von TCP besteht in der Bereitstellung eines sicheren Transports von Daten durch das Netzwerk.

UDP ist ein unzuverlässiges, verbindungsloses Protokoll. Unzuverlässig bedeutet in diesem Zusammenhang nicht, dass die Daten evtl. fehlerhaft beim Zielrechner ankommen, sondern, dass das Protokoll keinerlei Mechanismen zur Verfügung stellt, die sichern, dass die Daten auch tatsächlich beim Zielrechner ankommen. UDP bietet gegenüber TCP den Vorteil eines geringen Protokoll-Overheads.

Anwendungs-Schichten

Hierunter fallen alle Internet-Protokolle, die bereits für bestimmte Anwendungen geschrieben wurden (näheres dazu weiter unten), z. B.

  • HTTP (Hypertext Transfer Protocol) für WWW-Anwendungen ("Surfen")
  • SMTP (Simple Mail Transport Protocol) und POP (Post Office Protocol) zum Mailen
  • FTP (File Transfer Protocol) zum Übertragen von Dateien
  • ...

Der Domain Name Service (DNS)

Wie bereits im vorigen Kapitel besprochen, ist es Aufgabe des Internet-Protokolls, die Datenpakete an die richtige Adresse zu senden und dafür den besten Weg durch das Netzwerk zu suchen. In einem TCP/IP-Netzwerk werden Stationen mit ihrer IP-Adresse angesprochen. Eine solche IP-Adresse (nach IP Version 4) besteht binär aus 32 Nullen und Einsen. Sie kann jedoch auch dezimal mit vier Ziffernblöcken dargestellt werden, die durch einen Punkt getrennt sind. Ein Beispiel dafür wäre:

193.70.96.80

Dies macht es den digital arbeitenden elektronischen Schaltungen und Programmen der Stationen einfach IP-Adressen zu verarbeiten. Weder die 32-Bit-Folge, noch die IP-Adressen sind für das menschliche Gehirn einfach zu erfassen und zu verarbeiten. Der Mensch verwendet lieber Namen um eine Sache zu benennen und zu identifizieren. Diese Tatsache ist in den 70er-Jahren in das ARPANET, dem ursprünglichen Vorgänger des Internets, mit eingeflossen. Statt der IP-Adressen wurden Namen zu Adressierung von Computern verwendet. Diese waren für Menschen leichter zu merken und zu verstehen. So entspricht die IP-Adresse "193.70.96.80" dem Domain-Namen (URL)

www.ufg.ac.at
Bis heute ist es jedoch nicht möglich einen Computer mit seinem Namen über das Netzwerk anzusprechen. Für ihn besteht die Welt immer noch aus Bit und Byte. Aus diesem Grund wurde eine Methode entwickelt, um eine Namensauflösung von Namen in IP-Adressen zu realisieren: der Domain Name Service.

Der Domain Name Service (DNS) ist ein verteiltes, hierarchisches System zur Auflösung von Computernamen in IP-Adressen und umgekehrt. DNS geht auf die Datei hosts zurück, deren Inhalt zur Namensauflösung im ARPANET diente. DNS kennt keine zentrale Datenbank. Stattdessen sind die Informationen über viele tausend Nameserver (DNS-Server) verteilt. Der Client, der einen DNS-Namen in eine IP-Adresse aufgelöst haben will, stellt eine Anfrage an den DNS-Server. Der DNS-Server verwaltet IP-Adressen und die dazugehörigen Namen in einer Datenbank. Ist ein Name dort nicht enthalten, befragt er einen übergeordneten DNS-Server, bis eine IP-Adresse an den anfragenden Client zurück geliefert werden kann.

Mehr zum Aufbau von Domain-Namen finden Sie im Modul Syntax einer URL.

Folgende Grafik über die Entwicklung der Anzahl der Domainnamen international bzw. der at-Domains soll die Bedeutung des DNS noch einmal verdeutlichen:

Anwendungsspezifische Protokolle

Protokolle in der Anwendungs-Schicht regeln den Austausch von Daten bereits auf einer höheren, komplexeren Ebene, nämlich unter dem Gesichtspunkt der Verwendung. Die wichtigsten anwendungsspezifischen Protokolle sind:

HTTP

Hypertext Transfer Protocol;
Protokoll für das World Wide Web (WWW).

SMTP

Simple Mail Transfer Protocol;
Zum versenden von Emails.

POP

Post Office Protocol;
Zum Abrufen von Email von einem Mailserver.

FTP

File Transfer Protocol;
Zum Übertragen von ganzen Dateien im Internet.

NNTP

Network News Transfer Protocol;
Regelt den Austausch von Usenet-Postings im Internet. Das Usenet (USENET, urspr. Unix User Network) ist ein weltweites elektronisches Diskussions-Netzwerk, das aus Newsgroups besteht und an dem jeder, der z.B. über das Internet Zugang zu einem Newsserver hat, teilnehmen kann.

 

Internet-Dienste

Auf Basis der genannten Protokolle werden nun verschiedene Internet-Dienste angeboten. Dies kann beispielsweise der Email-Dienst zum Versenden von elektronischen Nachrichten sein, der sich des SMTP-Protokolls bedient. Dazu gibt es Programme, die die Benutzer verwenden, um einen Dienst in Anspruch zu nehmen (=Client-Programme), also z. B. ein Mailclient wie MS Outlook.

Die wichtigsten Internet-Dienste sind:

WWW

Das World Wide Web (WWW) ist neben Email der meistgenutzte Dienst. Es dient zum Präsentieren und Abrufen von Informationen im Internet. WWW-Seiten unterliegen dem Übertragungsprotokoll HTTP (= Hypertext Transfer Protocol, s.o.). Dabei werden einfache Textdateien übertragen, die neben dem Text für die Kern-Information auch Steuerbefehle enthalten, um den Text zu formatieren (z. B. fett zu drucken, in Tabellen zu formatieren etc.), sowie Bilder, Animationen, Verweise auf andere Dateien etc. Die "Sprache", in der WWW-Seiten verfasst werden, heisst HTML (= Hypertext Markup Language) - mehr dazu im Modul Aufbau einer Webseite.

Um beim "Internet-Surfen" WWW-Seiten betrachten zu können, wird ein sog. Browser benötigt. Es handelt sich dabei um ein Programm, das auf dem Client-Rechner (beim Benutzer) läuft und den in HTML-Sprache verfassten Text zuerst "übersetzt", d. h. Steuerzeichen interpretiert, und die enthaltene Information entsprechend formatiert darstellt. Gebräuchliche Browser sind Internet Explorer, Netscape Navigator, Mozilla oder Opera.

Das WWW vereinigt viele Internetdienste. Die bisher durch spezielle Einzelprogramme erreichbaren Informationen werden durch ein einziges Programm unter einer einheitlichen Oberfläche zugänglich. Im WWW gelangt man über einen Link in das entsprechende Angebot für FTP, Telnet, SSH, News, Whois, Wais oder NetChat (nähre Erklärungen im Folgenden).

Email

Mit dem Email-Dienst können Nachrichten auf elektronischem Weg über das Internet verschickt und empfangen werden. Zum Verfassen eigener und zum Betrachten empfangener Nachrichten wird ein Mail-Programm wie z. B. Outlook verwendet. Dabei werden auch mehrere Protokolle verwendet – meist SMTP zum Versenden und POP zum Empfangen von Emails.

FTP

Der Dienst heißt hier ebenso wie das zugrunde liegende Protokoll (FTP) und dienst zum Datentransfer im Internet. FTP ist die schnellste Methode der plattformunabhängigen Datenfernübertragung zwischen einem Server und einem Client in beide Richtungen ("Download" vom Server zum Client und "Upload" vom Client zum Server). Diese übertragenen Daten können Texte, Sounds, Graphiken, Animationen, Videos oder Software beinhalten. Die Übertragung der Daten (auch von Passwörtern!) erfolgt unverschlüsselt. Viele Server bieten auch die Möglichkeit von "Anonymous FTP", bei dem die Benutzer keine eigenen Zugangsdaten (Benutzername und Passwort) benötigen.

Zur Verwendung von FTP ist ein FTP-Client notwendig. Diese sind kostenlos für alle Plattformen im Internet verfügbar (z. B. WS_FTP, CuteFTP,...). Es kann aber auch die Kommandozeilenversion des jeweiligen Betriebssystems eingesetzt werden (z. B. unter Windows: Befehl ftp <hostname> in der Eingabeaufforderung).

Speziell für das Auffinden von Dateien auf FTP-Servern wurde die Suchmaschine Archie entwickelt, die jedoch mit der zunehmenden Verbreitung von anderen Suchmaschinen an Bedeutung verloren hat.

Telnet

Dieser Dienst ist identisch zum eingesetzten Protokoll benannt. Er entspricht im wesentlichen der Intention des ARPANET, durch Fernzugriff Ressourcen von entfernten Computern nutzen zu können. Man benötigt dazu einen eigenen Telnet-Client, d. i. ein Programm, das auf einem Rechner im Internet läuft, und mit dem man sich bei einem anderen Rechner anmelden kann, um dort Programme laufen zu lassen und Benutzereingriffe vorzunehmen. Telnet wird noch fallweise benutzt für den Zugang zu Datenbanken und Bibliothekskatalogen oder - besonders für Administratoren - zur Fernwartung von Servern im Internet. Wegen der Sicherheitsmängel (keine Verschlüsselung bei der Übertragung von Passwörtern, etc.) wird vom Einsatz von Telnet abgeraten. Stattdessen soll das sicherere Protokoll SSH verwendet werden.

SSH

SSH (Secure Shell) ist eine mittlerweile verbreitetere Variante von Telnet und bezeichnet ebenso ein Protokoll und einen Dienst. Der Unterschied bzw. die Verbesserung besteht darin, dass bei SSH die Daten verschlüsselt übertragen werden.

Module, die für die Durchführung vorausgesetzt werden