Rock Lee
Commander
- Registriert
- Apr. 2011
- Beiträge
- 3.013
Inflationsbereinigt ca 954 Euro, wenn wir schon dabei sinddavidzo schrieb:Was auch nur 600€ sind
Folge dem Video um zu sehen, wie unsere Website als Web-App auf dem Startbildschirm installiert werden kann.
Anmerkung: Diese Funktion ist in einigen Browsern möglicherweise nicht verfügbar.
Inflationsbereinigt ca 954 Euro, wenn wir schon dabei sinddavidzo schrieb:Was auch nur 600€ sind
cc0dykid schrieb:Prima Wallpaper-Material.
Nicht kann? MI300 hat 3 CCDs. Wenn man die GPU-XCDs weglässt, hätte man bei MI300 12CCD drauf packen können. Wenn man den Base Tile durch mehr Cache noch größer machen würde, würden auch mehr CCDs drauf passen.ETI1120 schrieb:Bei EPYC scheidet diese Lösung aus, weil man auf diese Art und Weise gar nicht alle CCDs mit dem IOD Verbinden kann.
Beim EPYC funktioniert es nicht weil der IOD nicht mit 12 CCD oder gar 16 CCDs per Hybrid bonding verbunden werden kann, es geht rein mechanisch nicht.Convert schrieb:Nicht kann?
Es gab Spekulationen, dass AMD so etwas bringen könnte, als Konkurrenz zu den Intel Max Series. Ja die Rechnung zeigt dass man damit wie bei Genoa 96 Kerne bereitstellen könnte. Aber es wäre eine Variante der MI300 und kein EPYC. Denn sie passt nicht in SP5, sondern würde in die Plattform derConvert schrieb:MI300 hat 3 CCDs. Wenn man die GPU-XCDs weglässt, hätte man bei MI300 12CCD drauf packen können. Wenn man den Base Tile durch mehr Cache noch größer machen würde, würden auch mehr CCDs drauf passen.
Das spielt bei der verfügbaren Speicherbandbreite die Rolle.Convert schrieb:Einziger Nachteil: Die MI300 hätte "nur" 256MB L4-Cache für 12 CCDs.
Ohne HBM hätte man keinen Hauptspeicher. Die IODs der MI300 haben kein DDR 5 Speicher Interface.Convert schrieb:Wenn man allerdings den Interposer weg lassen würde, weil man ja kein HBM braucht,
Ohne Interposer hast Du gar nichts weil dann die 4 IODs nicht gekoppelt sind.Convert schrieb:dann könnte man 32MB X3D-L3-Cache auf die CCDs packen, die CCDs mit X3D-L3 dann auf den Base Tile mit Speichercontroller/IO und L4-Cache drauf packen und man hätte wie bei MI 300 drei Schichten, nur statt Interposer unten die X3D-Caches oben und durch den L4-Cache im Base Tile hätten alle Kerne schnell mit einander komunzizieren können.
Kann man sich schon passend ausdenken. Man müsste halt den IOD passend designen (also nicht den von MI300 verwenden, sondern einen eigenen), dann könnte man auch so ein Package bauen. Dann bekommt der IOD halt DDR5 statt HBM3 Interface und über die Anzahl PCIe-Lanes kann man dann ja auch nochmal nachdenken. Physisch passen würde sowas auf jeden Fall, der MI300-Sockel SH5 ist ja von den Abmessungen her identisch zu SP5.ETI1120 schrieb:Natürlich kann man sich eine Architektur ausdenken bei der man CCDs per Hybrid Bonding auf einen IOD packt aber es kommt kein EPYC raus, der in die SP5 Plattform passt.
Danke für die Ausführung, leider verlierst du dich sehr stark in Details und im Wording und kommst am Ende doch irgendwie zu keiner anderen Aussage als ich?davidzo schrieb:Sorry, da sind ein paar Halbweisheiten drin, das kann ich so nicht stehen lassen:
Hier ein Beispiel dazu. Ich sprach von "Das ist nicht wie ne paar Millimeter dicke Platte" -> und du führst aus, dass der Rohwafer 0,5mm dick ist.davidzo schrieb:Doch genau das. Der Roh Wafer, also das was wir sehen ist immer 0,4 bis 0,5mm dick, also im Vergleich zu den Transistoren selbst ungeheuer dick. Wenn man auf die CPU guckt, guckt man auf die Rückseite des Wafers. Die feinsten Transistoren des ersten Logiklayers werden in diesen Wafer geätzt, mittels electroplating aufgefüllt und mit einer oxidschicht versehen. Alle darauf folgenden Schichten wachsen nach Oben aus Chipsicht, das heißt richtung Sockel. Diese werden erst auf dem kristallinen Wafer in einem chemischen Abscheideprozess "gewachsen". Nach jedem Auftrag kommt wieder photolack, Belichtung, Ätzen, elektroplatieren, oxidieren, aktivieren, wachsen, etc.
Auch hier, das ändert doch an der Aussage nichts? Es ist ein mehrschichtiges Gebilde. Ob jetzt gewachsen, gestapelt, gebeamt, ge- was auch immer, ist doch gar nicht entscheidend? Dieses Material trägt den Inhalt, die Logik, die Metal Layer usw. und schützt letztlich auch den Kram. Der Spaß wird in hochreinen Umgebungen gefertigt. So ne CPU kannst du ohne Deckel auch in den Dreck schmeißen und das geht immer noch. Das ist perse also irgendwo auch ein Schutz.davidzo schrieb:Nein, das ist kein Träger, das ist der Wafer selber. Beim Wafer von Schutzschicht zu sprechen ist nicht korrekt, weil er eben nicht nur die erste Lage an den feinsten Layern selbst beinhaltet, bzw. auch alle anderen dadurch dass es ein Mono-Kristall ist der nicht gestapelt sondern gewachsen ist.
Sagt im Endeffekt auch das gleiche wie oben, nur in der anderer Wortwahl - schleifst du den X3D Prozessor Die runter, dann kommt in der Mitte der Cache und an den Seiten schleifst du den Dummy weg.davidzo schrieb:Genau, der CPU-DIE wird abgeschliffen, dann kommt der Cache-DIE drauf und wird gebondet. Das was man sieht ist dann nicht mehr der Wafer vom CPU-DIE wie sonst sondern der Wafer vom Cache-DIE. Unterschiede in der Dicke des verbleibenden passiven Siliziumteils sind theoretisch vorhanden aber vernachlässigbar, weil der Metal stack im Chip selber wirklich nur hundertstel der Waferdicke ausmacht und der Wafer vom Cache sehr ähnlich dick sein wird wie der einer non-x3d CPU.
Von der Argumentrichtung her ja, aber die Überlegung der Leute hier und auch im Artikel war, dass die Wärme nicht an den Stellen primär abgeben wird, wo der Cache sitzt, einfach weil durch die Logikschaltung mehr Verlustleistung entsteht als durch die Cacheschaltungen, egal ob nun huckepack oder nicht.davidzo schrieb:Auf die Bereichen wo die Kerne sitzen wird bisher ein Silizium Dummy draufgeklebt. Das ist einfach rohes Wafermaterial in gleicher Dicke wie der Cache-Wafer. Ja, der verfügt über keine Kupferlayer und kein nachträglich gewachsenes Silizium aber ist auch je ein einzelner Kristall. Die Kupfer traces innerhalb des Cache-DIEs werden wegen der guten Wärmeleitfähigkeit von Kupfer eben höchstens einen positiven unterschied machen. Das Silizium ist praktisch gleich, weil es durch den chemischen Wuchs wieder ein Einzelkristall ist, genau wie der Dummy wafer auch. Nur waren es bisher halt mindestens vier zusammen geklebte Kristalle, der vom CPU-Die unten, der vom Cache drauf und zwei dummy-DIEs daneben über den Kernen. Wenn man das auf zwei reduziert dürfte das besser sein von der Wärmeleitung. Cache dürfte eigentlich besser die Wärme leiten als leeres Silizium was da bisher war.
Wenn du es so willst, mag das stimmen. Aber das war so nicht gemeint. Gemeint war, dass die horizontale Ebene nicht identisch sein muss und eben die Metallschichten unterschiedlich "dick" ausfallen können - je nach Prozess(or). Sprich die Aussage im Artikel (darauf war das ja bezogen), dass eine Lage Cache drauf pauschal hinderlich ist, muss lange nicht stimmen, weil es der Energie egal ist, durch was sie geht - die Summe aller Eigenschaften bestimmt wie gut oder schlecht das funktioniert. Ein Layer Logik mit einer Lage Cache drauf kann damit theoretisch auch besser die Wärme abführen als eine Lage Logik ohne Cache, wenn andere Gegebenheiten für schlechtere Wärmeleitfähigkeiten sorgen.davidzo schrieb:Das ist eben nicht korrekt. EIn Chip besteht sehr wohl nur aus einer Lage Silizium. Das ist wie gesagt dem Umstand geschuldet dass Siliziumwafer ein Monokristalliner Werkstoff sind und per chemischen Wachstumsprozess hergestellt werden.
Was du meinst sind die Metal Layer in dem Prozess, die bei modernen Prozessen schon über 30 sein können.
Das ist vollkommen klar und wurde meinerseits auch nicht in Abrede gestellt. Ich stellte allerdings in Frage, ob möglicherweise die Verbindung mit dem Huckepack Cache durch andere Eigentschaften bspw. dazu führen kann, dass das dennoch zu einem guten bis vielleicht sogar besseren Ergebnis führt?davidzo schrieb:Zwei gebondete Chips wie bei X3D sind sehr wohl physisch total unterschiedlich gegenüber einem einzelnen Stück Silizium.
Man muss halt differenzieren - weil ein Teil der Anwendungsleistung kommt durch AVX512 bzw. den dortigen größeren Zugewinn. Das siehst du in Benches, in Games halt nicht.Tharan schrieb:Dass sich eben schon etwas getan hat, was man ja auch an der Anwendungsleistung sieht, v.a. unter Linux. Und auch die Umgruppierung ist ja ein nicht kleiner Schritt, da darauf dann auch kommende Generation und weitere Zugewinne aufbauen können, vielleicht nun ja auch im X3D-Bereich.
fdsonne schrieb:Gemeint war, dass die horizontale Ebene nicht identisch sein muss und eben die Metallschichten unterschiedlich "dick" ausfallen können - je nach Prozess(or).
Diese Aussage im Artikel ist korrekt. Es ist genau das was AMD erzählt.fdsonne schrieb:Sprich die Aussage im Artikel (darauf war das ja bezogen), dass eine Lage Cache drauf pauschal hinderlich ist,
Materialien leiten Wärme unterschiedlich gut.fdsonne schrieb:muss lange nicht stimmen, weil es der Energie egal ist, durch was sie geht -
genau und deshalb hat AMD hat bei Zen 3 und Zen 4 das Cache Chiplet nicht über den Kernen platziert.fdsonne schrieb:die Summe aller Eigenschaften bestimmt wie gut oder schlecht das funktioniert.
Du übersiehst den großen Elefanten im Raum.fdsonne schrieb:Ein Layer Logik mit einer Lage Cache drauf kann damit theoretisch auch besser die Wärme abführen als eine Lage Logik ohne Cache, wenn andere Gegebenheiten für schlechtere Wärmeleitfähigkeiten sorgen.
Dass 12 CCDs nicht auf den aktuellen IOD passen, ist nun wirklich jedem klar. Darum ging es auch nie. Es ging um einen neuen IOD, der auch Cache integriert hat. Ob man jetzt eine CPU mit Hybrid Bonding nicht SP5-kompatibel hinbekommen kann, weiß ich nicht. Wenn man aus dem neuen IOD alle Leitungen an die gleichen Pins in dem Sockel hin schiebt und alle Versorugungsleitungen von den Sockelpins zu den CCDs durchleitet, wäre es vielleicht möglich. Vielleicht hast du aber recht und es ist nicht möglich. Ja gut, dann haben wir halt einen anderen/zusätlichen Sockel. Ist ja nicht so, als würde sich AMD von einem zusätzlichen Sockel von irgend einem Produkt abhalten lassen. Vor Zen 4 gab es auch weniger Sockel...ETI1120 schrieb:Beim EPYC funktioniert es nicht weil der IOD nicht mit 12 CCD oder gar 16 CCDs per Hybrid bonding verbunden werden kann, es geht rein mechanisch nicht.
Natürlich kann man sich eine Architektur ausdenken bei der man CCDs per Hybrid Bonding auf einen IOD packt aber es kommt kein EPYC raus, der in die SP5 Plattform passt.
Epyc ist einfach nur der Name der Serverprozessoren bei AMD. Eine MI300 ohne GPUs, sondern nur mit CCDs wäre demnach auch ein Epyc oder "Epyc MAX" oder was auch immer sich das Marketing ausdenkt. Genau so wie bei Intel alle Serverprozessoren Xeon heißen, oder eben Xeon MAX, wenn die auf einen anderen Sockel und mit HBM daher kommen, statt nur mit DDR5.ETI1120 schrieb:Und ohne Plattform taugt eine CPU nichts.
Es gab Spekulationen, dass AMD so etwas bringen könnte, als Konkurrenz zu den Intel Max Series. Ja die Rechnung zeigt dass man damit wie bei Genoa 96 Kerne bereitstellen könnte. Aber es wäre eine Variante der MI300 und kein EPYC. Denn sie passt nicht in SP5, sondern würde in die Plattform der
MI300A passen.
Warum hätte die CPU nur 48 PCIe Lanes? Wenn ich ein neues IOD baue, dann kann ich auch entscheiden, wie viele PCIe-Lanes ich in das IOD einbaue. Ich hab doch gar nicht darüber gesprochen, dass man schon vorhandene IOD benutzen solle, sondern dass man ein neues IOD mit Cache bauen kann.ETI1120 schrieb:Das spielt bei der verfügbaren Speicherbandbreite die Rolle.
Wichtiger sind dass das Teil nur 48 PCIe Lanes hätte und beim Speicherausbau ziemlich begrenzt ist. Es wäre eine HPC CPU. Braucht man so etwas?
Oh man. Natürlich hat der IOD des MI300 kein DDR5-Controller. Deswegen soll ja auch ein neuer IOD gebaut werden, der statt HBM-Controller DDDR5-Controller eingebaut hat. Oder hast du irgendwo gelesen, dass ich geschrieben habe, man solle den IOD vom MI300 1:1 übernehmen?ETI1120 schrieb:Ohne HBM hätte man keinen Hauptspeicher. Die IODs der MI300 haben kein DDR 5 Speicher Interface.
Jo, deswegen sollte man dann auch nicht 4 IODs nehmen, sondern einen großen. Hab ich was von 4 IODs geschrieben? Nein. Ein IOD mit Cache und Speichercontroller und PCIe, so viele wie man braucht.ETI1120 schrieb:Ohne Interposer hast Du gar nichts weil dann die 4 IODs nicht gekoppelt sind.
Du machst einfach ein IOD, der so groß ist wie vier IODs, und schon kannst du 12 CCDs drauf bauen. Ich verstehe nicht, warum du ständig bereits vorhandene Teile des MI300 verwenden willst. Das Konzept lehnt sich lediglich an MI300 an, aber die Chip-bestandteile sollen nicht aus dem MI300 entnommen werden.ETI1120 schrieb:Mit einem einzelnen IOD hättest Du eine CPU mit 24 Kernen. Dafür wären die Infinity Links mit denen die anderen IODs angeschlossen werden wieder verfügbar.
Die Vorteile habe ich genannt. Du hättest einen gemeinsamen L4, so dass du weniger X3D auf dem Chiplet stapeln musst und alle Kerne einer CPU wären über den L4 auch mit einander verbunden und die Effizienz würde steigen, weil die Kommunikation zwischen iOD und Chiplets nicht mehr über den Low-Cost Substrat laufen muss. Du hättest immer noch einen IOD in älterer Fertigungsstufe, aber eben zusätzlich mit Cache. Nachteil wäre, dass der IOD mit dem Cache noch größer wäre, als das aktuelle. Ob sich das rechnet, weiß ich natürlich nicht. Vielleicht lohnt es sich auch tatsächlich eher vier IODs zu nehmen und diese mit "EMIB" (weiß nicht wie das TSMC-Equivalent dazu heißt) mit einander zu verbinden...ETI1120 schrieb:Ich bezweifle, dass es sich lohnt dafür eine Plattform zu entwickeln.
Es hat doch aber auch Niemand behauptet, dass das das gleiche ist!?ETI1120 schrieb:Aber diese Ebenen M0 bis M15 der Metallisierung sind etwas anderes als zwei Silizium Dies, per Hybrid Bonding verbunden werden.
Exakt das ist doch die Unbekannte dabei - wie viel Metall ist da wie verbunden um vielleicht irgendwelche schlechten Materialübergänge so zu kompensieren, dass das letztlich trotzdem gut aufgeht?ETI1120 schrieb:Materialien leiten Wärme unterschiedlich gut.
- Silizium besser als Siliziumoxid.
- Das Kupfer in den TSVs besser als das Silizium außen herum.
- Die Kupfer zu Kupfer Verbindung bei Hybrid Bonding erheblich besser als ein Lotverbindung bei Micro Bumps.
- ...
In der Tat - aber das wissen wir doch?ETI1120 schrieb:genau und deshalb hat AMD hat bei Zen 3 und Zen 4 das Cache Chiplet nicht über den Kernen platziert.
... auch das sagte ich bereits. Ist das jetzt Absicht erst zu sagen, ich überseh was und dann in Teilen die selbe Aussage zu bringen?ETI1120 schrieb:Auch im Cache entsteht Wärme und diese Wärme addiert sich zur Wärme die in der Logik entsteht.
WENN, ja wenn das so ist, dann wäre das wie Hätte Hätte Fahrradkette. Versteh mich nicht falsch, aber so funktioniert die Argumentation nicht. Du musst nicht MICH überzeugen, warum das so bisher gebaut wurde, das ist doch klar und auch öffentlich bekannt. Mir ging es darum darauf hinzuweisen, dass das keineswegs der Weisheit letzter Schluss ist und damit geänderte Ansätze möglicherweise Dinge möglich machen, die bisher eben nicht getan wurden. Das Argument mit einem Produkt der Vergangenheit zu belegen und zu sagen, ja wurde so nicht gemacht ist sehr dünn. Weil es eben nicht belegt, warum es so gemacht wurde, sondern lediglich das Resultat zeigt. War es gar nicht möglich? War es lediglich günstiger es so zu machen? Waren andere Parameter dafür verantwortlich? Niemand weis das... Wäre aber notwendig zu wissen um pauschal zu sagen, Cache auf Logik = Mist.ETI1120 schrieb:Wenn die maximale Wärmeabfuhr konstant ist, verringert jedes Milliwatt das im Cache in Wärme umgesetzt wird das Wärmebudget des Kerns. Außerdem wird die Temperatur in den Teilen des Caches über den Kernen höher sein als über den Teilen des Caches, die sich über Cache befinden.
Es ist in der Technik oft so dass ein grundlegend neuer Ansatz in seiner ersten "Massenproduktion" noch nicht das ganze Potential ausschöpft weil man sich erst mal darauf konzentriert das ganze wirtschaftlich gangbar zu machen, es also ohne großartigen Ausschuss in die Produktion zu bringen. Der aktuelle Mehrwert ist gering, aber das Potential schon absehbar.NEO83 schrieb:Ich bleibe gespannt und finde ZEN5 aktuell zwar gut aber er ist eben nicht der Überflieger für den ihn alle gehalten haben vorher ... Hyptrain sei dank ...