News Intel Xeon Phi: Erste Wafer-Bilder zeigen riesigen Die mit 76 Kernen

72x atom ..... WOW ich bin beeindruckt ........ nicht
 
Wüßte einmal gerne, was die bei so einem großem Die an Ausschuß haben.

@haha
Langsam wird es aber schwer irgend etwas zu finden wo der FX 8350 mit den aktuellen Intel CPU's noch mithalten kann. Klar, wer den ganzen Tag zippen tut, der kann das mit dem FX 8350 relativ billig machen.
 
Luffy schrieb:
72x atom ..... WOW ich bin beeindruckt ........ nicht

Aufgrund der 2 AVX512 Einheiten pro Kern liegt die theoretical peak Performance pro Kern doppelt so hoch wie bei einem gleich hoch getakteten Modell der Core-i Reihe.
 
wieso werden wafer eigentlich bis zum rand "bedruckt"?

bei kleinen chips ja noch verständlich, aber bei diesem werden ja bestimmt 100 milliarden transistoren umsonst erzeugt
 
Klikware schrieb:
Das Problem ist schlichtweg auch der Bedarf der Leute. CPUs halten recht lange, und wenn Leute nur alle 5-8 Jahre upgraden lohnt es nicht.

Naja, wenn ich im Bekanntenkreis schaue, wer alles wieder einen neuen Rechner gekauft hat wird mir schwindelig. Da ist seit 4 jahren ein zugemülltes Windows drauf und der PC wird eben langsam...wen wunderts...
Von dem her muss Intel sich bei Windows bedanken, dass die Software bzw. die Benutzer einfach kacke sind xD
 
Infect007 schrieb:
Naja, wenn ich im Bekanntenkreis schaue, wer alles wieder einen neuen Rechner gekauft hat wird mir schwindelig. Da ist seit 4 jahren ein zugemülltes Windows drauf und der PC wird eben langsam...wen wunderts...
Von dem her muss Intel sich bei Windows bedanken, dass die Software bzw. die Benutzer einfach kacke sind xD

Intel muss sich bei MS bedanken, dass die Benützer kacke sind? Also die Logik verstehe ich nicht wirklich. Was hat MS da für einen Einfluss darauf?
 
JamesFunk schrieb:
Aber selbstverständlich.
Meinst du das ernst (ich meine das oben nicht ernst). Intel will gar nichts. Und daran ist nicht die Software schuld, sonder die schwache Leistung von AMD.
Intel muss gar nicht. Die verkaufne auch so ihre CPUs. Leider.

Das ist mal wieder ein blinder Trugschluss. Aber ja, Bashing ist immer nett. Im Serverbereich muss was kommen, da machen schon die Hersteller von HP und co. genug Druck, dann mit eine neue Generation erscheint. Außerdem nicht den P8 vergessen, zwar miese Performance/Watt aber gute Leistung. Das endet daran das seit Jahren im Serverbereich stetig die Leistung im ordentlich Umfang steigt. Es kommen ja mit jeder neuen Generation ständig neue Kerne dazu.

Smagjus schrieb:
Gar nicht so viel mehr (grad 300W gelesen), da die mit um die 1Ghz laufen. Das sind auch keine "standalone" Prozessoren, sondern Coprozessoren, die im PCIE Slot laufen - siehe bspw. Amazon.

Gibt es auch Standalone für den Server Sockel.


Die Diskussion driftet ja ordentlich vom Thema ab. Warum man das immer mit dem Desktop vergleichen möchte.
 
Zuletzt bearbeitet:
@haha

7zip ist da aber auch klar als Ausnahme zu sehen. Andere Anwendungen die hauptsächlich auf Arithmetik setzen wie zum Beispiel Compiler laufen auf den Intel CPUs wieder weit flotter (siehe Linux Bench, Kernel). Also selbst dort wo die Bulldozer Architektur kein Nachteil hat, ist sie bis auf Ausnahmen nicht sonderlich gut.
Als Bulldozer neu war, was der Arithmetikdurchsatz durchaus für viele Anwendungen brauchbar. Aber mittlerweile stimmt das selbst kaum noch.

@general-of-omega

Zum einen kann man den Rand nutzen, um zu verfolgen wie gut der Prozess läuft. Anstatt einen funktionierenden Chip zu opfern oder gar Testfelder mitten auf dem Wafer vorzusehen nutzt man den Ausschuss. Zum anderen sollte der ganze Wafer möglichst homogene Eigenschaften haben. Es wäre mehr als ungünstig, wenn die Oberfläche am Rand andere Eigenschaften hätte beim Beschichten als der Rest. Bei den verwendeten Beschichtungsverfahren könnte es so dazu kommen, dass der Rand durch besser oder schlechter Benetzungseigenschaften Material anhäuft und so vom benachbartem Die abzieht, oder aber durch eine schlechtere Benetzung sich Material zum benachbartem Die verschiebt. Ein Alptraum!
 
Ich kann mich daran erinnern, das in den gefühlt letzten 10 Jahren immer wieder diese News mit dem Phi hier gepostet wurde. Und nun? In jedem Jahr steht dann da ne andere Zahl bei der Anzahl der Kerne und keiner brauchts von den hier Anwesenden. Diese News ist eigentlich total unwichtig, außer Äußerungen wie "wow, was alles möglich ist" und "damit läuft xy mit 5000 fps" zu provozieren.
 
Bitte was?

Ich bin mir sehr sicher das einige hier oft Bilder/Videos rendern. Ich persönlich profitiere (in naher Zukunft) von mehr und mehr Rechenleitung (egal in welcher form).

Die schwache KI in spielen ist ziemlich jämmerlich, genauso wie die Physik und Sound. Für realistischen Sound kann man die Räumliche Anordnung der Objekte nutzen um Hall und Frequenzfilterverhalten in Echtzeit für eine Veränderliche Szene zu berechnen, das schluckt auch schon viele GFLOPS...

Werdet ihr sicher auch in Battlefield 2146413632 sehen, dann sagt wieder jeder "ah, das ist geil, da *muss* ich mir einen neuen Computer kaufen"
 
Simon schrieb:
Sofern die postulierten 3 TFLOP/s DP-Leistung erreicht werden sollen, müsste der Vollausbau mit 72 Kernen mit ca. 1,3 GHz takten.

Heißt ja sogar 3+ TFLOP/s. Man kann also davon ausgehen, dass man das Top-Modell mit >1,3 GHz sieht. Die Verzögerung ist hauptsächlich der Fertigung zu zuschreiben. Erste Exemplare habe ich schon Anfang 2015 gesehen und wurde auch schon lauffähig auf der IDF ausgestellt. Blades mit Host Phi hatten auch schon die Runde gemacht. Für November war schon der erste HPC-Cluster geplant, hatte es dann aber doch nicht ganz in die Liste geschafft.

KNL dürfte noch einmal ordentlich an der Verbreitung im HPC-Bereich fördern. Aktuell 63% NVIDIA, 25% Intel und lächerliche 3% AMD (exklusive Combi Tesla+Intel). Unsere Jungs lieben es statt jetzt Cuda zu verwenden, einfach die x86 Software zu portieren und auf AVX umzulegen. Spart mal locker 30% Arbeitszeit ein. Steckt Intel weiterhin so viel Energie in die Software der Phi und dem Support kann es für andere Rechenbeschleuniger von NVIDIA oder AMD ziemlich schnell eng werden.

Die nächste Version wird wohl ein QPI Interface bekommen, dann kann man bis zu 4 Sockets in einem Blade/Server unterbringen. Dann zieht wohl auch 3D XPoint ein, was zu einer vierten Speicherebene führt. Die im Hybrid Mode (AutoHBW) betrieben und der Programmierer muss sich um Speicher erstmal nicht mehr kümmern.

Ich warte auch noch auf Versionen mit >16GB MCDRAM :D Ist doch etwas knapp bei 384GB DDR4 für den Cache.
 
Zuletzt bearbeitet:
Woodz schrieb:
Ich kann mich daran erinnern, das in den gefühlt letzten 10 Jahren immer wieder diese News mit dem Phi hier gepostet wurde. Und nun? In jedem Jahr steht dann da ne andere Zahl bei der Anzahl der Kerne und keiner brauchts von den hier Anwesenden. Diese News ist eigentlich total unwichtig, außer Äußerungen wie "wow, was alles möglich ist" und "damit läuft xy mit 5000 fps" zu provozieren.


Xeon Phi ist bereits in der 3. Generation das ist also so wie zu behaupten gefühlte 10 Jahre immer mal wieder von vom Core I zu hören.

Achtung Halbwissen:

1. Gen Pentium Pro Kerne
2. Gen auch Pentium Pro mit breiteren Registern also MMX und SSE
3. Gen Airmont Kerne mit 2xAVX 3.1 also 512bit breite Register.

Und da liegt auch der Hund begraben das ding kann zwar x86 aber alles was nicht parallel laufen kann und die Register voll bekommt oder wenigstens ne Handvoll Kerne mit Standart Code auslasten kann läuft halt genauso schnell wie auf jedem 0815 Atom Tablet.

Also Railnation läuft kacke das kann ich euch versprechen -_-
 
Zuletzt bearbeitet:
Steeeep schrieb:
Und da liegt auch der Hund begraben das ding kann zwar x86 aber alles was nicht parallel laufen kann und die Register voll bekommt oder wenigstens ne Handvoll Kerne mit Standart Code auslasten kann läuft halt genauso schnell wie auf jedem 0815 Atom Tablet.

Das hat man aber bei jeder Hardware die auf Threads setzt, GPU, Rechenbeschleuniger ala Phi oder massive core architectures wie Tilera. Hat man das nicht setzt man keine der oberen Arten ein. Sollte wohl klar sein. Da die Phi aber nur da eingesetzt wird, wo die Arbeit schön verteilt werden kann ist es egal.
 
Ein vergleich zum 28kerner xeon (skylake ep) wäre auch interessant ...
Wenn ich hier lese das die 2x avx 512 pro kern die prokernleistung verdoppeln also 72 kerne @ 2,6 ghz vs 28 kerne @? 2,5 bis 2,7ghz ... also ca. die halbe Leistung wie die Phi? aber dann hat die Phi noch 16gb sauschnellen ram ...


Bin schon neugierig was aus Rex computing wird ...

mff
 
@strex Wollte damit auch eher so auf die "läuft da Day-z" drauf posts antworten.

der 28Kern Xeon ist Flexibler der Xeon PHI brauch massive Parallelisierung wie andere Grafikkarten auch nur ist er halt leichter zu programmieren und läuft auch Stand Alone. Also nicht so wirklich vergleichbar.
 
Zuletzt bearbeitet:
In dem letzten Thread, wo es um die Teile ging, hieß es, dass es vom Mainboard her Unterstützung geben muss. Es gibt zwar Consumer-Boards, die theoretisch damit umgehen könnten, diese beschränken sich aber meist auf den x99 Chipsatz.

Dann brauchst du noch speziell dafür kompilierte Software. Aber da lasse ich lieber Experten sprechen, denn mit meinem Wissen reichts hier auch nicht mehr wirklich (ich wurde ja hier im Thread auch schon berichtigt).
 
Du brauchst halt Code und Aufgaben die die AVX Register vernünftig auslasten aber sonst sollte alles grundsätzlich Out of the Box zumindest auf der Sockelversion drauf laufen egal ob sinnvoll oder nicht.

Mal andere Frage an die Experten was dürfte eigentlich auf Dauer günstiger werden?

Der Interposer wie bei AMD für die Fury welcher ja im Grunde ein sehr grober Silizium Chip ist.
Oder einfach klassisch wie bei Intel nur sehr extrem kompakt den Stapelspeicher über das Package anzubinden.
Der Datendurchsatz zum On Package Stapelspeicher bzw HBM ist ja bei beiden identisch.
 
Zurück
Oben