Gentzsch-Interview Die Zukunft liegt im Grid

Die nächste Stufe des World Wide Web heißt Grid. Doch was ist das eigentlich? netmanager fragte Wolfgang Gentzsch, Director Grid Computing bei Sun Microsystems. Acht Fragen - acht Antworten.

netmanager:

Herr Gentzsch, wie definieren Sie den Begriff Grid?

Wolfgang Gentzsch: Der Begriff Grid - übersetzt Gitter, Netz - leitet sich vom amerikanischen "Power Grid" ab; das ist die Elektrizitätsinfrastruktur, die uns den Strom ins Haus liefert. Dazu gehören zum Beispiel das Kraftwerk, das Umspannwerk, die Hochspannungsmasten und Leitungen, genauso wie der Sicherungskasten und die Steckdosen zu Hause.

Genauso wie wir heute den Strom aus der Steckdose erhalten, werden wir in einigen Jahren Computeranwendungen auf unseren Computermonitor projizieren, die von irgendeinem entfernten Computer-Kraftwerk generiert und bearbeitet werden und übers Netzwerk zu uns gelangen. Die gesamte Infrastruktur, die dies ermöglicht, nennen wir das Grid.

Dazu gehören die großen Computer, die unsere Berechnungen durchführen, und die Software zum Betreiben dieser Computer - so genannte Middleware, Tools und die Software für unsere Anwendungen, das Netzwerk sowie natürlich unsere Endgeräte - die so genannten Appliances, PCs, Sunrays - zu Hause und unterwegs. Die Software auf diesen Endgeräten nennen wir Portals, weil sie uns wie ein "Sesam-öffne-Dich"-Portal den Zugang zu dieser Internet-Infrastruktur und zu unseren Anwendungen eröffnet.

Eine einfachere Definition: Das Grid ist die nächste Generation des World Wide Web, das neben den heute mehr Informations- und E-Commerce bezogenen Diensten nun auch komplexe Anwendungen, Berechnungen und Kooperationen als Internet-Services beziehungsweise als "Utility" ermöglicht.

Wir unterscheiden im wesentlichen drei Stufen eines Grid: das lokale Cluster Grid, das Campus oder auch Enterprise Grid und das Globale Grid. Unterscheidungsmerkmale sind die Zusammensetzung der Benutzer beziehungsweise Besitzer wie beispielsweise für ein Projekt, mehrere Projekte, mehrere Abteilungen, verschiedene Niederlassungen. Weiteres Merkmal ist die Verteilung der Rechner - zum Beispiel lokal, auf ein und demselben Campus oder über das Internet verstreut.

netmanager: Welche kommerziellen Einsatzmöglichkeiten sehen Sie für die Grid-Technologie? Binnen welchem Zeitraum werden diese Einsatzmöglichkeiten Realität werden?

Gentzsch: Zunächst einmal: Das Grid kann man weder kaufen noch verkaufen. Es ist wie mit dem Internet und mit dem Web. Das Grid ist die Infrastruktur, die völlig neue Geschäftszweige eröffnet, neue Produkte ermöglicht, neuartige Dienstleistungen hervorbringt.

Im Moment entwickeln sich gerade Einsatzmöglichkeiten für Grids in der Forschung: Forscherteams beginnen, weltweit vernetzt zusammenzuarbeiten, zum Beispiel die etwa 10.000 Wissenschaftler, die die Petabytes von experimentellen Daten aus dem Teilchenbeschleuniger am Genfer Hochenergiephysikzentrum Cern analysieren und die Ergebnisse diskutieren, dabei jedoch in ihrem Institut irgendwo auf der Welt sitzen. Oder Tausende von Bioinformatikern, die zum Entwickeln neuer Medikamente ihre eigenen Ergebnisse aus der Genforschung mit Millionen von ähnlichen Datensätzen vergleichen, die in zahlreichen Gendatenbanken auf der ganzen Welt verstreut gespeichert sind.

Kommerziell interessant sind heute schon die so genannten Cluster-Grids, die mit ihren zum Teil Hunderten von vernetzten Prozessoren wie Pilze aus dem Boden schießen und dort die alten Mainframes ersetzen. IDC hat schon im letzten Jahr ermittelt, dass über 35 Prozent der Computer-Anwender über eine solche lokale Cluster-Lösung nachdenken.

Die nächste Stufe, das Campus oder Enterprise Grid, wird heute schon von vielen unserer Kunden geplant. Wir haben längst begonnen, gemeinsam mit unseren Kunden und Partnern komplexe, verteilte Grid-Infrastrukturen aufzubauen, in Universitäten, Forschungseinrichtungen, und demnächst in der Industrie. Die dazu nötige Software ist einfach noch zu frisch, noch nicht ausgereift, noch nicht voll in die anderen Architekturschichten integriert. Schließlich wird die letzte Stufe, das Globale Grid, dann interessant, wenn wir den "fremden" Rechnern ohne Sicherheitsrisiko unsere Daten und Programme anvertrauen können.

Es ist kaum noch eine Frage der Technologie, die im Wesentlichen heute schon vorhanden ist und in Grid-Software wie Globus, Avaki/Legion, Cactus oder Sun Grid Engine eingebaut ist.

Wie unterscheidet sich Grid von einfacher Software?

netmanager: Unterstützt Sun bei der Grid-Technologie offene Standards wie Globus, oder setzt Sun eher auf proprietäre Standards?

Gentzsch: Viele Software-Werkzeuge von Sun basieren selbstverständlich auf offenen Standards. Zum Teil hat ja Sun diese Standards selbst mit geprägt, wie zum Beispiel Java oder Jini, oder sogar die Quellprogramme dazu veröffentlicht, als so genannte Open Source, und sie den Software-Entwicklern in der ganzen Welt zur Verfügung gestellt.

Beispiele dafür sind die Bürosoftware Star Office und die Grid-Management-Software Sun Grid Engine. Sun Grid Engine ist der Manager für lokale Computing-Cluster, während Globus und Avaki (Legion) auf der nächsten Ebene diese Cluster miteinander verbinden, so dass die Ressourcen miteinander kommunizieren und aufgeteilt werden können. Wir müssen also offene Standards unterstützen, um die Zusammenarbeit aller Tools und Ressourcen zu ermöglichen. Sun Grid Engine zum Beispiel unterstützt die Grid-Infrastruktur Software Globus und Legion schon seit zwei Jahren.

netmanager: Inwieweit unterscheidet sich die Sun Grid Engine von konventioneller Software, die eingehende Jobs je nach Auslastung auf die einzelnen Rechner eines Rechenzentrums verteilt?

Gentzsch: Die Basisversion von Sun Grid Engine macht genau das: Ankommende Rechenaufträge werden auf den am besten geeigneten und am wenigsten beladenen Rechner geschickt. Damit treiben Sie die Auslastung einer vernetzten Rechnerlandschaft von vielleicht 30 Prozent auf über 90 Prozent.

Das Top-Modul von Sun Grid Engine, der Ressourcen-Broker, geht noch einen Schritt weiter: Er plant die Aufteilung der Rechner-Ressourcen auf der Basis einer Firmen-Strategie. Zum Beispiel kann das Management eines Automobilkonzerns über den Broker vereinbaren, dass 70 Prozent aller Rechenkapazität für Computer-Crash-Simulationen zur Verfügung gestellt werden, 20 Prozent sind für die Verbesserung des CW-Wertes und die restlichen 10 Prozent für andere Aufgaben.

Der Sun Grid Engine Broker sorgt dafür, dass diese Aufteilung eingehalten wird. Ohne diesen Broker gilt auch heute häufig noch, dass, wer am lautesten schreit, die meisten Ressourcen bekommt. Und das muss dann nicht immer auch der wichtigste Mitarbeiter sein.

Während die meisten Computer-Management-Systeme nur passiv auf den Status der Rechnerlandschaft reagieren können, ermöglicht der Sun Grid Engine Broker die aktive, ja präventive Planung der Ressourcen. Das unterscheidet ihn von allen anderen Systemen in dieser Gewichtsklasse.

Ein anderer, nicht unerheblicher Unterschied zu anderen Systemen ist, dass Sun Grid Engine nichts kostet, und dass sogar der Quellcode, also alle 500.000 Programm-Zeilen, von der Sun-Webseite heruntergeladen werden können.

netmanager: Versteht sich die Sun Grid Engine auch mit heterogenen Hardware-Umgebungen?

Gentzsch: Genau dieser Unterschied, nämlich dass der Quellcode von Sun Grid Engine frei verfügbar ist, versetzt jeden Benutzer in die komfortable Lage, den Code für jeden beliebigen Rechner zu übersetzen, sei es ein Rechner von Intel, IBM, HP, Compaq, SGI, oder sei es für Linux. Sun Grid Engine ermöglicht sogar die Kooperation von Rechnern verschiedener Hersteller innerhalb eines gemeinsamen Rechner-Clusters. Mehr "Open Standard" geht nicht.

Cluster bei BMW und Volkswagen

netmanager: Können Sie ein Unternehmen nennen, das am Aufbau eines firmeninternen Grid-Netzes arbeitet?

Gentzsch: Man kann ganz allgemein sagen, dass viele Unternehmen heute schon zumindest die erste Grid-Stufe, das lokale Computing-Cluster, implementiert haben. Die Mitarbeiter von Konzernen wie BMW und Volkswagen oder Bayer und Novartis haben schon heute ihre Campus-weiten Rechner miteinander vernetzt und von überall Zugriff darauf, teils sogar von zu Hause.

Globale Konzerne, die über Kontinente verstreut sind wie Automobilfirmen zum Beispiel mit Werken in Deutschland und in den USA, die über ein so genanntes PVN - Private Virtual Network - miteinander verbunden sind, planen im Moment gerade die globale Nutzung ihrer Ressourcen; eine Möglichkeit, die sich unter anderem aus dem Zeitunterschied zwischen Deutschland und den USA ergibt.

General Motors testet momentan ein Department-übergreifendes Enterprise Grid, die Bioinformatik-Firmen Caprion in Montreal und Inpharmatika in London haben soeben ein großes Cluster Grid von Sun installiert. Wir arbeiten im Moment vielleicht mit etwa 50 Großkunden an Campus- und Enterprise-Grid-Lösungen.

netmanager: IBM hat vor wenigen Wochen eine großangelegte "Grid-Computing-Initiative" verkündet. Wie beurteilen Sie deren Inhalte? Plant Sun eine ähnliche Initiative?

Gentzsch: Nach IBMs Ankündigung habe ich vergeblich versucht, IBMs Grid-Produkte auf der IBM-Web-Seite aufzuspüren. In der IBM-Ankündigung, die ich gelesen habe, wurde nur eLiza explizit erwähnt, und das ist ein ehrgeiziges Software-Projekt mit Fokus auf "Self Management" von Clustern. Das hat zunächst nichts mit Grid Computing zu tun, eher etwas mit deren Zuverlässigkeit, und es wird sicher noch länger dauern, bis es auf dem Markt ist.

Es sieht ganz so aus, als ob IBM seine proprietäre Mainframe-Technologie umpositionieren möchte, um auf der Grid-Welle mitreiten (mitreden) zu können. IBM ist wohl zunächst noch im Stadium einer Initiative. Denn wegen der Komplexität des Grid-Themas ist Grid Computing natürlich eine goldene Service-Kuh, und das ist wiederum IBMs Stärke.

Im Gegensatz zu IBM braucht Sun keine Grid-Computing-Initiative zu planen: Wir sind schon seit Jahren in diesem Bereich des "Network Computing" aktiv. Hier liegt der große Unterschied zu anderen Herstellern. Wir haben schon Mitte der neunziger Jahre mit unseren Regensburger Entwicklern, damals noch als Genias Software GmbH, für große EU-Projekte Grid-Management-Software entwickelt.

Beispiele dafür finden Sie über die Suchmaschine www.google.com: Projekte wie Europa, Unicore, Autobench, Julius, und Medusa. Unsere Grid-Software ist schon seit zwei Jahren an die weitverbreiteten Grid-Produkte Globus und Avaki/Legion angedockt. Damit bauen wir heute schon Grids mit unseren Kunden.

Eine andere wichtige Netzwerk-Computing-Technologie, Jini, ist schon vor über fünf Jahren veröffentlicht worden. Scott McNealy, unser Vorsitzender, hat schon vor 15 Jahren gesagt: The Network is the Computer. Sun hat ein eigenes Department und eine konzernweite Arbeitsgruppe für Grid Computing.

netmanager: Wo sehen Sie im Bereich der Grid-Technologie den größten Entwicklungsbedarf, wo liegen die Hürden, die einem Durchbruch dieser Technologie noch im Wege stehen?

Gentzsch: Es fehlen insbesondere die Standard-Schnittstellen, die es ermöglichen, die zahlreichen Grid-Softwarewerkzeuge und die verschiedensten Grids zusammenzuschalten, sodass sie miteinander kommunizieren und kooperieren können. Auf diesem Gebiet ist das Global Grid Forum tätig, eine Vereinigung von etwa 500 Wissenschaftlern, die in verschiedenen Arbeitsgruppen an Standardisierungen arbeiten. Ein einheitliches Lego-ähnliches System wird aber noch einige Jahre auf sich warten lassen.

Eine weitere Hürde sind sicher auch die Netze oder Datenautobahnen, auf denen sich datenintensive Anwendungen heute noch stauen. Da müssen wir von den heutigen Megabit/s noch eine Größenordnung zulegen, insbesondere für den industriellen Nutzen. Es wird sicher noch zwei bis drei Jahre dauern, bis wir die nötigen Gigabit/s von einem Ende bis zum anderen Ende zur Verfügung haben.

Und sicher ist da auch noch unsere persönliche Einstellung eine Hürde. Nur ungern geben wir unseren eigenen Computer unter unserem Schreibtisch auf und tauschen ihn gegen ein simples Endgerät für 500 Mark, mit Direktanbindung an alle Rechner dieser Welt, die wir selbst nicht besitzen, die wir aber jederzeit und überall anzapfen können. Bis wir dann Rechenkraft genau so transparent nutzen können wie Elektrizität, Wasser oder wie unser Telefon, werden wohl noch zehn Jahre in die Lande ziehen.


Neue Netze: Das Supernetz 

Mehr lesen über