|
Das Internet - Geschichte und Technologie
(aus einer Seminararbeit von Michael Heim)
Enstehung des Internets
Das Internet wurde ende der Siebzigerjahre unter dem Namen ARPA-Net
vom US-Verteidigungsministerium und amerikanischen Hochschulen "gegründet".
Ziel war es, ein dezentral organisiertes Netzwerk zu errichten,
das auch einen atomaren Krieg überstehen würde. Zu Beginn wurde
es ausschliesslich durch Universitäten betrieben, genutzt und entwickelt.
Man muss sich das sehr unwirklich vorstellen.
Die erste Übertragung war der Gestalt, dass ein Wort, das an einer
Uni in den Computer getippt wurde, an der anderen Uni wieder angezeigt
wurde. Der Gedanke an das noch vor 10 Jahren sehr verbreitete Betriebssystem
MS-DOS lässt erahnen, wie das Internet damals aussah.
Facts "Hardware"
Über die "Hardware Internet" kann man auf verschieden Varianten
kommunizieren (Anwendungssschicht). Die bekannteste ist das World
Wide Web (WWW), das es ermöglicht, grafisch gestaltete Texte in
einer einheitlichen Sprache anzubieten (Protokoll: HTTP). Es wird
umgangssprachlich oft und falsch schlicht Internet genannt. Ein
anderer Dienst ist E#mail(Protokoll: SMTP), der es erlaubt, elektronische
Post zu versenden. Telnet ist ein Dienst, der es erlaubt, Computer
übers Internet anzusteuern und zu bedienen. FTP ist schliesslich
ein Dienst, über den Dateien transportiert und verwaltet werden
können. FTP wird beispielsweise verwendet um Internetseiten zu aktualisieren.
(Weitergehende
Informationen zum Schichtenmodell, extern)
Aufgabenverteilung - Nomenklatur im Internet
Grundlage des Internets sind einerseits die grossen Hauptdatenleitungen
zwischen den wichtigsten Orten der Welt und die Zentralrechner,
die an diesen Knotenpunkten stehen. Dieses Hauptnetz, das mit Glasfaserkabeln
und Satellitenverbindungen arbeitet, nennt man das Backbone-Netz.
An dieses Netz sind weitere Nebenleitungen angeschlossen. Wichtig
aus der Sicht dieser Vernetzung ist, dass alle ans Internet angeschlossenen
Computer über dasselbe Protokoll kommunizieren. Dieses Protokoll
ist das TCP/IP und bildet die Basis für die weiter oben erwähnten
Anwendungen.
Grundsätzlich kann in einem Netzwerk zwischen Clients und Servern
unterschieden werden. Ein Client ist normalerweise ein Computer,
der eine Abfrage machte. Er sucht nach Informationen, stellt aber
anderen Computer (und deren Benutzern) keine Informationen zu Verfügung.
Der Server dagegen ist ein Computer, der Informationen zur Verfügung
stellt. Als Dokumentenserver verwaltet er z.B. Dokumente, die von
den Mitarbeitern für ihre Arbeit verwendet werden. Der Web-Server
verwaltet die Daten für den Internet- oder den Intranet-Auftritt
und der mailserver verwaltet die elektronische Post. Grundsätzlich
kann im Internet und unter TCP/IP jeder Rechner sowohl Server als
auch Client sein . Aus Gründen der Verwaltbarkeit und der Sicherheit
macht es aber Sinn, hier zu unterscheiden.
Jeder Rechner, der ans Internet angeschlossen wird, wird als Host
bezeichnet. Ein Host besitzt normalerweise nur eine Verbindung;
die zum nächsten Rechner. Innerhalb des Internets sorgen Router
für den Versand der Daten. Sie registrieren die Zieladresse eines
Datenpakets und leiten es an den nächsten Netzwerkknoten weiter
(Mehr zum Datenfluss im nächsten Abschnitt). Router verfügen also
über mehrere Netzwerkverbindungen.
Das Netzwerkprotokoll TCP/IP
TCP/P ist das Transferprotokoll, das die Übertragung der Daten
koordiniert. Protokolle "enthalten Absprachen über den Aufbau, die
Überwachung und den Abbau von Verbindungen" (Stahlknecht 99, S.112).
TCP/IP ist aber nicht nur ein einzelnes Protokoll, sondern eine
ganze Familie von Protokollen, die alle für verschiedene Funktionen
auf verschiedenen Schichten zuständig sind (mehr zum Schichtenmodell
in Stahlknecht 99, ab S. 111 oder hier).
Zu diesen Protokollen gehören:
- FTP , SMTP , HTTP als Protokolle für Anwendungen (Anwendungssschicht)
- TCP als Protokolle für eine Host to Host-Verbindung (Transportschicht)
- IP als Protokoll fürs Internet und (Adressierung)
- Ethernet oder Token Ring als Protokolle für das lokale Netzwerk
(Physikalische Schicht)
TCP/IP ist schon so alt wie das Internet. Als in den 60erjahren
das ARPANET entstand, wurden zahlreiche Protokolle entwickelt. Anfangs
der 80erjahre schrieb dann das US-Verteidigungsministerium vor,
dass alle Rechner, die mit dem ARPANET verbunden sind, über die
Protokolle TCP und IP kommunizieren müssten. Diese einheitliche
Regelung war gleichzeitig die Geburtsstunde des Internets
Wie funktioniert TCP/IP? Grundsätzlich passiert bei einer Datenübertragung
nichts anderes, als dass der eine Computer die Daten in ein Kabel
einspeist und der andere sie wieder ausliest. Bei einer PC-Direktverbindung
auf kurze Distanz oder bei der Verbindung eines PCs mit dem Drucker
macht das auch Sinn. Voraussetzung für diese Übertragungstechnik
ist jedoch eine einwandfreie Verbindung ohne Datenabbruch.
Werden die Daten über TCP/IP verschickt, geschieht die Übertragung
etwas anders. Kurz gesagt: Sie werden zerhackt und in Päckchen verschickt.
Dieses Aufteilen wird Packet Switching genannt (Oplliger 98, S.16).
Jedes Päckchen ist über eine Bestimmungs- und Absenderadresse beschrieben.
Ausserdem sind die Datenpakete durchnummeriert, so dass der Verlust
einer Einheit sofort registriert wird. Dadurch, dass die Pakete
kleiner sind, als wenn die Daten aufs mal verschickt würden, sind
die Kosten eines Übertragungsausfalls geringer. Ein anderer Vorteil
ist, dass die einzelnen Päckchen nicht den selben Weg wählen müssen.
Sie können parallel über verschiedene Datenleitungen verschickt
werden (Mocker 98, S.37).
Etwas genauer: Jedes der Päckchen bekommt zwei IP-Nummern zugewiesen
(auf die IP-Nummern wird im nächsten Abschnitt eingegangen). Die
eine Nummer beschreibt den Absender, die andere Nummer den Empfänger
der Daten. Diese Adressierung ist die Aufgabe vom Internet Protocol
(IP). Es stellt die Verbindung her, kontrolliert aber nicht, ob
auch alle Daten korrekt übertragen wurden.
Für diese Kontrolle ist das Transmission Control Protocol zuständig.
Wie der Name besagt, nummeriert das TCP die Datenpakete und kontrolliert,
ob am Bestimmungsort alle Daten angekommen sind. TCP kann auch mit
anderen Protokollen als dem IP zusammenarbeiten. In der Regel werden
die beiden aber als Paar verwendet (Candance 01, S.85).
IP-Nummern
Jeder Rechner, der direkt ans Internet angeschlossen ist, besitzt
eine eigene IP-Nummer. Jede dieser Nummer darf nur einmal vergeben
werden, da sonst keine eindeutige Zuordnung mehr möglich wäre. Die
IP-Nummern müssen nicht fest vergeben sein. Wenn Computer nur unregelmässig
aufs Internet zugreifen, macht es sinn, ihnen jedes Mal eine neue
IP-Nummer zuzuteilen, da so in der Zwischenzeit die Nummer für andere
Rechner verwendet werden kann und weniger IP-Nummern benötigt werden.
Die IP-Nummer besteht aus vier dreistelligen Zahlen, die jeweils
durch einen Punkt getrennt sind. Jede der vier Zahlen steht für
ein Byte, kann also die Werte 1 bis 254 annehmen (Mocker 98, S.
43). Die genauere Funktion der vier Zahlen beschreibt Candance (Candance
98, S. 214).
Dieses System der Einmaligkeit gilt nicht nur für die ans Internet
angeschlossenen Rechner, es lässt sich eins zu eins auch auf Intranets
übertragen, da sich das Intranet technisch in dieser Beziehung nicht
vom Internet unterscheidet. Auch hier hat jeder Rechner eine eigene
IP-Nummer.
IP-Name und DNS
Zur Vereinfachung der Computeradressen hat man das Namensystem
eingeführt. Jeder Rechner bekommt neben seiner IP-Nummer einen Namen
zugeordnet, der sich mit Bestimmtheit leichter merken lässt als
die IP-Nummer.
Die Übersetzung der Namen in Nummern geschieht über Tabellen, in
denen beides gespeichert ist. Diese Tabelle könnte theoretisch auf
jedem Computer gespeichert sein. Dies würde in einem kleinen Netzwerk
funktionieren, bei einem grossen Netz wie dem Internet wird sie
aber zentral gespeichert. Der Dienst, der die Tabelle verwaltet
heisst Domain Name Service (DNS). Wenn nun an einem Computer ein
IP-Name eingegeben wird, stellt dieser eine Verbindung zum DNS-Server
her, um die zugehörige IP-Nummer abzufragen (Mark 97, S. 86).
Zusammen mit dem Namen der abgefragten Datei bildet der IP-Name
die URL (Uniform Ressource Locator), welche umgangssprachlich oft
einfach Internet-Adresse genannt wird. Währenddem im Internet die
IP-Nummern und -Namen von der Internet Corporation for Assigned
Named and Numbers (ICANN) bzw. in ihrem Namen von den Internet Service
Providern, vergeben werden, ist es im Intranet die Aufgabe des Netzwerkadministrators,
jedem Computer einen Namen zu geben (Candance 98, S. 213)
HTTP - Das WWW-Protokoll
Währenddem TCP/IP den allgemeinen Datenverkehr im Internet regelt,
ist das Protokoll HTTP für die Kommunikation innerhalb des WWW-Dienstes
verantwortlich. Im World Wide Web kommunizieren dabei jeweils der
Web-Server und der Web-Browser (Client) miteinander.
Die Primäre Aufgabe des HTTP besteht darin, die Abfrage von Webseiten
zu ermöglichen. Diese Abfrage läuft über den einfachen Befehl GET.
Wir der Befehl GET zusammen mit einem Dateinamen an einen HTTP-Server
geschickt, so übermittelt dieser die genannte Datei an den absendenden
Browser.
HTML - die Sprache des World Wide Web
Das weltweite Netz, die Protokolle und die IP-Nummern setzen zwar
die Voraussetzung für die Internetkommunikation, davon bemerkt aber
der Endbenutzer nicht viel. Was ihn interessiert ist die Kommunikationsplattform.
Zu Beginn des Internetzeitalters funktionierte die Kommunikation
im Netz über Befehle, die in einer DOS-ähnlichen Umgebung eingegeben
wurden. Diese Umgebung war nicht sehr attraktiv und wurde deshalb
auch nur von wenigen Menschen benutzt.
Den entscheidenden Durchbruch brachte das Prinzip des Word Wide
Web, das auf dem Protokoll HTTP und der der Hyper Text Markup Language
(HTML) basiert. HTML ist eine Sprache, die Ende der 80erjahre am
CERN in Genf entwickelt wurden und die es den Mitarbeitern erlauben
sollte, schnell und einfach ihre Forschungsergebnisse zu publizieren.
Hypertext-Dokumente bestehen aus einem speziell strukturierten Text
und enthalten Verweise auf andere Dokumente oder Objekte. Es spielt
dabei keine Rolle, ob die Verweise lokal sind, oder ob sie auf eine
weiter entfernte Datei verweisen, die z.B. auf einem Server in Australien
liegt.
Die in HTML verfassten Dateien erkennt man in der Regel an den
Dateiendungen *.htm oder *.html. Im Grunde genommen ist HTML nichts
anderes als ein speziell strukturierter Text im ASCII-Code. Zwischen
den Textstellen befinden sich sog. Tags, die dem Browser sagen,
wie er den Text anzuzeigen hat. Über die Tags lassen sich auch Grafiken,
Programme oder Multimedia-Elemente einbinden.
Ein Beispiel: Der Tag <b> kündet an, dass der folgende Text
fett angezeigt werden soll (von bold). Die fett gedruckte Textstelle
wird mit einem End-Tag </b> abgeschlossen.
Auch die Verknüpfungen werden über Tags eingebunden. Vor dem mit
der Verknüpfung zu unterlegenden Wort steht der Tag, der die Verknüpfung
beschreibt, z.B. <a href = "http://www.unibas.ch">. Das Ende
wird wieder durch den End-Tag gesetzt (<a>).
|