News Intel Xeon Phi: Knights Landing in vier Modellen ab 2.438 US-Dollar

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.788
Zur ISC 2016 lässt Intel deutlich verzögert aber direkt mit einem neuen Weltrekord im Gepäck die neuen Xeon Phi vom Stapel. Die unter dem Codenamen Knights Landing entwickelte Neuauflage bietet bis zu 72 Prozessorkerne und 16 GByte On-Package-Speicher und wird in vier Varianten für 2.438 bis 6.532 US-Dollar angeboten.

Zur News: Intel Xeon Phi: Knights Landing in vier Modellen ab 2.438 US-Dollar
 
sry für die vll dumme Frage, aber ist das eine ganz normale x86/x64-CPU oder wofür wird so ein Xeon Phi gebraucht?
 
@NighteeeeeY

Nicht mehr in allen Varianten. Einige Varianten agieren selbst auch als Host-Prozessor und ermöglicht eine höchst effiziente Beschleunigung. Die auf der KNL verbauten x86 Kerne sind aufgebohrte Silvermont-Kerne aus dem normalen Portfolio wie wir sie von den Atoms kennen und sind binär kompatibel.
 
Zuletzt bearbeitet:
Ich glaube da kommt Intel mal zu spät. Die sind Nvidia um 5 Jahre zurück. Ist auch gut so, müssen nicht überall die Nase vorn haben. Warum 64 langweilige x86 cpus, wenn ich doch 4000 Cuda Kerne haben kann?
 
nebulus schrieb:
Warum 64 langweilige x86 cpus, wenn ich doch 4000 Cuda Kerne haben kann?

Weil sich nicht alles gut GPU beschleunigen lässt?
 
@nebulus

Sollte ein Witz sein oder? Bezüglich der Effizienz ist hier Intel ein großes Stück weiter. Denn Intel kann sich den kompletten Host sparen und spart sich hier locker schnell mal 200 bis 400W ein die alle anderen Lösungen von NV oder AMD bis dato benötigen. NV kann hier nicht mitziehen, da eine x86 Lizenz fehlt und AMD bis dato keine Lösung dafür vorgestellt hat. Vielleicht ist man mit Zen in der Lage ähnliches zu basteln.

Wer heute spitzen Flops pro Watt benötigt kommt, um die KNL nicht herum. Schaut man sich die neue Top500 Liste an, geht's wieder Richtung CPU statt GPUs:

Eine weitere Besonderheit diesmal ist, dass es mit jetzt 93 weniger Systeme mit GPUs oder Rechenbeschleunigern in der Liste gibt als zuvor, da waren es noch 104.

http://www.heise.de/newsticker/meldung/Supercomputer-China-ueberholt-die-USA-3241342.html
 
Und btw. hat der Phi eine sehr gute DP Leistung.
Mal sehen ob sich der Nachfolger was das angeht wieder erfolgreich gegen AMD/NVIDIA Konkurrenten durchsetzen kann.
 
@strex Man sollte vielleicht noch erwähnen, dass die XeonPhi Kerne Teile des AVX512 Befehlsatzes unterstützen, im Gegensatz zu den original Silvermont Kernen welche nur SSE (128bit) unterstützen.

@nebulus Die Cuda Cores sind nur eine reine Marketing Angabe. Mal davon abgesehen sind weniger starke Kerne wesentlich besser als viele schwache, da erstere viel einfacher auszulasten sind.
 
@ZuseZ3

Da hat man sich schon kräftig mit den ersten Modellen etabliert. Nicht umsonst konnte Intel mit der Phi zig Systeme ausstatten und NV kräftig Paroli bieten obwohl sie immer etwas weniger Rohleistung hatten. Was am Ende dann aber real rauskommt, konnte Intel sehr gut überzeugen.

@Headcool

Dazu hatte ich ja geschrieben "aufgebohrte" Kerne. 4fach Hyperthreading kommt ja auch noch dazu. Damit ist dann sogar ein einfacher Boot von Windows oder Linux möglich.

So gesehen ist es aktuell auch das schnellste (FP, Stream,..) 1-Sockel System der Welt, wenn man es denn so betreiben möchte. Dabei ist es noch nichtmal die schnellste Variante:

Der kann nicht nur selber booten – braucht also keinen Host-Prozessor mehr und kann ungebremst auf den Hauptspeicher zugreifen – sondern auch Standard-Software fahren, wie sie etwa in der SPEC-CPU2006-Suite enthalten ist. Einfach mit den neuen Compilern kompilieren, laufen lassen und schon legt der Xeon Phi 7250 mit seinen 68 Kernen und vierfach Hyper-Threading mit 842 SPECFP_rate_2006base einen neuen Weltrekord für 1-Prozessor-Systeme aufs Parkett und fegt damit "endlich" den 32-kernigen Konkurrenten SPARC T7-1 vom Sockel (801 Punkte). Bei SPECint kann er sich mit 828 Punkten ebenfalls gut sehen lassen, das hat man von so einem HPC-Chip gar nicht erwartet.

Jetzt fehlt nur noch QPI in der nächsten Generation mit 10 TFlops DP pro Sockel und die Xeons kann man für einige Bereich ausmustern :evillol: Dazu müsste nur noch der 10nm Prozess gut laufen.
 
Zuletzt bearbeitet:
Beim Host-Prozessor jede Software die Cores über >68 ansprechen kann. Unterstützung von AVX und co. wäre natürlich von Vorteil.
 
Und welche Software kann das?

btw benötigt man noch Treiber dazu? Wie wird das in das OS integriert?
Muss dafür extra wie zb mit OpenCL programmiert werden?
 
Zuletzt bearbeitet:
Das OS läuft auf dem Host-Modellen, der Scheduler kümmert sich um die Verteilung. Wie man es von gängigen Dual oder Quad Core aus dem Desktop auch kennt.
 
Wie oft denn noch, wenn deine Software 8 und mehr Cores auslasten kann, wird es damit auch zurecht kommen. Unterstützt es dann noch AVX und co. noch besser. Außer es ist wieder limitiert auf unter 68 Cores. Bei 68 Cores stehen 272 logische Cores zur Verfügung. Ich habe auf Testsystemen auch nur einen reinen Webserver (ngnix) betrieben, kein Problem. Bei Windows wird es schon schwieriger, das hat bei der hohen Anzahl >256 an Threads so seine Probleme. Linux und ffmpeg (mit passender -thread option und passenden codec) sollte das kein Problem machen.

Kurz, es ist eine x86 CPU mit 68 Cores und 272 Threads. Unterstützt deine Software die Anzahl an Threads bzw. kann es diese auslasten und läuft am Besten und Linux muss man nichts tun außer OS booten und Software starten. Dabei verhält es sich "fast" wie ein Xeon mit hoher Core-Anzahl. Bezüglich Memory-Mode und Befehlssätze muss man sich halt an der verwendeten Software orientieren und eventuell experimentieren was max. Auslastung bringt.

Wer aber schon solche Fragen stellt, ist nicht die Zielgruppe und scheitert dann wohl auch am Budget für ein solches System.
 
Zuletzt bearbeitet:
Schade die Crysis Frage hat mir einer Vorweg genommen :D

Aber hat AMD was ähnliches in petto oder kommen da nur wieder die Wünsche das Zen auf magische Art und Weise Intel in die Schranken weisen wird? - Frei nach dem Clarkeschen Gesetz: „Jede hinreichend fortschrittliche Technologie ist von Magie nicht zu unterscheiden.“ :evillol::evillol::evillol:
 
strex schrieb:
Wer aber schon solche Fragen stellt, ist nicht die Zielgruppe und scheitert dann wohl auch am Budget für ein solches System.

Danke für die Erklärung
Habe mich eben noch nicht damit beschäftigt und wollte mal ne Info wie man das Teil anspricht usw.

Na Hauptsache du gehörst zur Elite die sich das leisten kann ^^
Muss ja Unerschiede geben... der ganz gewöhnliche Pöbel braucht natürlich keine Leistung.^^
 
@ExigeS2

Von AMD hat man bezüglich einer solche Lösung noch nichts gehört. Die wollen sich doch selber nicht den "fast nicht vorhanden" Marktanteil der GPUs im HPC zerstören. Die werden wohl lieber ihre vielleicht kommenden Lösungen mit GPU+HBM und Zen als APU verkaufen wollen. Da bleibt aber der Markel der schlechten Effizienz übrig. Die brauchen alle noch einen Host. Auch wenn vier GPUs verbaut werden, muss man hier jeder der GPUs 1/4 von 200 bis 400W zurechnen und natürlich der umständlichen/aufwändigen Programmierung.

Intel hat damit im HPC ein recht gute eierlegende Wollmilchsau geliefert. Transparente Memory-Stufen, Memory-Modi, hohe Performance, einfache Programmierung, sehr gute Effizienz, schneller Interconnect,..

cbtestarossa schrieb:
Danke für die Erklärung
Habe mich eben noch nicht damit beschäftigt und wollte mal ne Info wie man das Teil anspricht usw.

Da schaut man sich die Dokumentationen dazu an. Umfangreiche Erklärungen gibt es bei Intel.

cbtestarossa schrieb:
Na Hauptsache du gehörst zur Elite die sich das leisten kann ^^
Muss ja Unerschiede geben... der ganze genwöhnliche Pöbel braucht natürlich keine Leistung.^^

Ich käme nie auf die Idee mir so etwas privat zu kaufen..Der "Pöbel" lässt sich vom Systemhaus fachmännisch beraten wenn er selbst keine Ahnung hat und stellt nicht zehn mal dieselbe Frage. Besonders wenn er HPC-Lösungen zuhause betreiben möchte.
 
Zuletzt bearbeitet:
Zurück
Oben