Schönen Mittwochnachmittag
Ich bin gerade dabei, ein Referat auszuarbeiten.
Es handelt sich um das Fachreferat in der zwölften Klasse an der Fachoberschule, Wirtschaftszweig, Dauer 15 bis 20 Minuten.
Eines vorweg: Das Niveau des Referats wird, beziehungsweise darf nicht allzu anspruchsvoll sein, da ich einer von zwei Schülern in der Klasse mit gutem Informatikwissen bin. Es muss also für Laien verständlich sein.
Jetzt habe ich bereits verschiedene Quellen mit Informationen gefunden:
welche datenbank verwendet google
Was mich fast etwas geschockt hat, da ich davon ausgegangen war, dass Googles Suchmaschine mit Datenbanken funktioniert. Ich selbst habe mit Datenbanken keine allzu große Erfahrung, ich kenne mich halt gut mit Excel und Access aus, nichts weltbewegendes also
Daraufhin habe ich folgende Seiten gefunden:
Google File System und natürlich Google.
Englischsprachige Treffer habe ich recht viele gefunden, allerdings haben diese meine Englischkenntnisse überschritten. Englische Zeitungsartikel/Foren/Geschichten sind ok, aber technische Artikel sind zu viel für mich...
Den groben Aufbau habe ich hoffentlich richtig verstanden:
An einem Master hängen mehrere Chunkserver, die "stinknormale" PCs sind. Ist der Master auch ein Standard-PC oder ein Server und wenn ja, in welcher Größenordnung? Zwei Xeon-Quads wie die CB-Server oder wesentlich mehr Prozessoren?
Auf den Clients sind die Daten gespeichert, natürlich redundant. Suchanfragen werden an das (topologisch) nächste Rechenzentrum geschickt, dort werden die Daten auf den Clienten zusammengesucht und an den fragenden PC gesendet.
Pro Rechenzentrum gibt es einen Master und hunderte/tausende Chunkserver. (Ich möchte lieber nicht den Energiebedarf eines solchen Rechenzentrums wissen.)
Die Festplatten sind nicht mit NTFS oder ext3 formatiert, sondern mit Googles Eigenentwicklung GFS (Google File System). Betriebssystem ist Linux, eine angepasste Red Hat Distribution.
"Die Programmiersprachen C, C++ und Python spielen essentielle Rollen bei der Implementierung der proprietären Suchmaschinensoftware."
Diesen Satz würde ich gerne noch einmal kurz erläutert bekommen
Das ist doch (laienhaft ausgedrückt) die dritte "Ebene", also GFS --> Linux --> Software, oder?
Am Ende des Referats werde ich dann auch noch ein paar Minuten für Kritik hernehmen. Stichwörter: Finanzierung durch personalisierte Werbung, Datenschutz, Zensur (China), Gefahr eines Informationsmonopols,...
Abgabetermin für das Thesenpapier ist Freitag, das eigentliche Referat werde ich wohl irgendwann zwischen Februar und April halten müssen. (Wir bekommen ab dieser oder nächster Woche einen neuen Lehrer in IT, deswegen steht der Termin noch nicht fest.)
Ich freue mich auf eure Unterstützung, schonmal ein Dankeschön im Voraus
Ich bin gerade dabei, ein Referat auszuarbeiten.
Es handelt sich um das Fachreferat in der zwölften Klasse an der Fachoberschule, Wirtschaftszweig, Dauer 15 bis 20 Minuten.
Themenvorgabe vom Lehrer war grob "Datenbanken", da das unser Themengebiet dieses Jahr ist. Eingetragen in die Liste für's Thema habe ich "Datenbanken Google". Es soll also über Datenbanken am Beispiel von Google gehen.
Eines vorweg: Das Niveau des Referats wird, beziehungsweise darf nicht allzu anspruchsvoll sein, da ich einer von zwei Schülern in der Klasse mit gutem Informatikwissen bin. Es muss also für Laien verständlich sein.
Jetzt habe ich bereits verschiedene Quellen mit Informationen gefunden:
welche datenbank verwendet google
Was mich fast etwas geschockt hat, da ich davon ausgegangen war, dass Googles Suchmaschine mit Datenbanken funktioniert. Ich selbst habe mit Datenbanken keine allzu große Erfahrung, ich kenne mich halt gut mit Excel und Access aus, nichts weltbewegendes also
Daraufhin habe ich folgende Seiten gefunden:
Google File System und natürlich Google.
Englischsprachige Treffer habe ich recht viele gefunden, allerdings haben diese meine Englischkenntnisse überschritten. Englische Zeitungsartikel/Foren/Geschichten sind ok, aber technische Artikel sind zu viel für mich...
Den groben Aufbau habe ich hoffentlich richtig verstanden:
An einem Master hängen mehrere Chunkserver, die "stinknormale" PCs sind. Ist der Master auch ein Standard-PC oder ein Server und wenn ja, in welcher Größenordnung? Zwei Xeon-Quads wie die CB-Server oder wesentlich mehr Prozessoren?
Auf den Clients sind die Daten gespeichert, natürlich redundant. Suchanfragen werden an das (topologisch) nächste Rechenzentrum geschickt, dort werden die Daten auf den Clienten zusammengesucht und an den fragenden PC gesendet.
Pro Rechenzentrum gibt es einen Master und hunderte/tausende Chunkserver. (Ich möchte lieber nicht den Energiebedarf eines solchen Rechenzentrums wissen.)
Die Festplatten sind nicht mit NTFS oder ext3 formatiert, sondern mit Googles Eigenentwicklung GFS (Google File System). Betriebssystem ist Linux, eine angepasste Red Hat Distribution.
"Die Programmiersprachen C, C++ und Python spielen essentielle Rollen bei der Implementierung der proprietären Suchmaschinensoftware."
Diesen Satz würde ich gerne noch einmal kurz erläutert bekommen
Das ist doch (laienhaft ausgedrückt) die dritte "Ebene", also GFS --> Linux --> Software, oder?
Was ich jetzt bräuchte, sind ein paar Anregungen und Quellen.
Vor allem: "Inwiefern nutzt Google datenbankbasierte Anwendungen?"
Kennt jemand eine Seite, auf der "Datenbanken bei Google" betrachtet werden?
Vor allem: "Inwiefern nutzt Google datenbankbasierte Anwendungen?"
Kennt jemand eine Seite, auf der "Datenbanken bei Google" betrachtet werden?
Am Ende des Referats werde ich dann auch noch ein paar Minuten für Kritik hernehmen. Stichwörter: Finanzierung durch personalisierte Werbung, Datenschutz, Zensur (China), Gefahr eines Informationsmonopols,...
Abgabetermin für das Thesenpapier ist Freitag, das eigentliche Referat werde ich wohl irgendwann zwischen Februar und April halten müssen. (Wir bekommen ab dieser oder nächster Woche einen neuen Lehrer in IT, deswegen steht der Termin noch nicht fest.)
Ich freue mich auf eure Unterstützung, schonmal ein Dankeschön im Voraus
Zuletzt bearbeitet von einem Moderator:
(Lexikon-Link korrigiert)