News Epyc und Instinct: AMD Data Center Premiere Virtual Event am 8. November

Salutos schrieb:
Müsste das nicht heißen
"Milan-X mit 768 Megabyte 3D V-Cache"
Es scheint dass alle Milan-X 768 MB Cache haben. 😉
Er ist halt vorsichtig.

konkretor schrieb:
Auf den Multi GPU Support bin ich gespannt.
Auf was spielst Du an:
Auf die 2 Chiplets: Die sollen laut den Patenten wie eine GPU agieren
Auf die neue Version des Infinity fabric und die größere Anzahl der Links?

konkretor schrieb:
500 Watt ist ne Ansage.
Ja. Aber HPC ist nun Mal ein Segment bei dem die Rechenleistung im Vordergrund steht.

Und trotz der 500 W steigt die Effizienz enorm

konkretor schrieb:
Hoffentlich tut sich mal was beim Support von der Software. Läuft ja fast alles auf cuda
Es hat sich bei HPC doch schon längst etwas getan.
https://rocmdocs.amd.com/en/latest/
In den letzten Jahren sind viele Open Source Pakete an HIP (Cuda Äquivalent von AMD) angepasst worden.

Das Problem für eine breite Anwendung außerhalb von HPC ist, dass ROCm momentan nur auf Linux läuft und dass offiziell RDNA1 und RDNA2 nicht unterstützt werden. Obwohl hier offensichtlich Änderungen bevorstehen.

Rockstar85 schrieb:
Nichts desto trotz braucht AMD mehr foundry Kapazität.
Die bekommen sie doch. Schrittweise mit N7 und mit dem Umstieg auf N5
Rockstar85 schrieb:
Ich hoffe vllt die kleinen Modelle bald von Samsung zu sehen.
Nein, das kann sich AMD nicht leisten. Das ist vom Designaufwand viel zu teuer.
stefan92x schrieb:
Bin mal gespannt, ob die neuen Instinct überhaupt noch in normalen Systemen funktionieren werden, oder nur mit Trento zusammen.
Nach allem was die Gerüchteküche hergibt eher nein.

Wobei ich mir vorstellen kann, das eine Version für PCIe-Slots nachgereicht wird, wenn tatsächlich Bedarf besteht.

Allerdings wenn AMD dafür sorgt dass Server-Mainboards für die neuen Sockel verfügbar sind, wird der Markt für das PCIe-Format sehr klein.
 
Danke euch für die kurzen Statements. Ja die Probleme liegen sicherlich im Detail. Mein Netzwerker hier schwört auf Intel (wie beim Essen, was der Bauer nicht kennt 😂). Einzig für eine gewisse Fachsoftware haben wir ne AMD Maschine mit 96 Threads stehen, da sich die Berechnungszeit von über 12h auf rund 3h verringert hat.
 
konkretor schrieb:
@Oberst08 ja das ist richtig das oft eigene Software für solche Karten genutzt werden.

In der KI Welt ist CUDA von Nvidia nicht weg zu diskutieren. TensorFlow eines der wichtigsten Frameworks mag am liebstens die CUDA Schnittstelle. Klar gibt es mittlerweile ein paar Forks, die sind aber oft hinter her.
Oder es gibt Wrapper die dann eben nach CUDA übersetzen.
TensorFlow wird die Betreiber von HPC Systemen aber nicht unbedingt interessieren (zumindest nicht Oak Ridge). Außerdem gibt es seit Jahren schon ein Paket von AMD für ihre GPUs, das gibt's nur nicht offiziell auf der TF Seite, sondern direkt bei AMD. Wie das hinsichtlich Geschwindigkeit aussieht, weiß ich zwar nicht, aber TF dürfte sich durchaus im Klaren darüber sein, dass ein reiner Fokus auf CUDA mit dem Einstieg von Intel im Bereich der GPUs ein Fehler wäre.
Insofern würde ich nicht davon ausgehen, dass man OpenCL weiterhin so stiefmütterlich behandelt, denn über Kurz oder Lang wird Intel mit ihren GPUs da auch einige Marktanteile von NVidia holen.
Vor allem im HPC Bereich ist die Vormachtstellung von NVidia sowieso gefährdet, weil AMD und Intel Komplettpakete aus CPU und Beschleuniger anbieten und das auch optimieren. AMD will mit El Capitan einen Interconnect zwischen den Genoa Epycs und den Instinct Beschleunigern umsetzen und einen unified Speicherbereich anbieten, was dann die Programmierung vereinfacht. Intel wird sicher ähnliches planen. Da NVidia aktuell noch keine passende CPU bietet, hat man hier einen Nachteil gegenüber der Konkurrenz. Wer als Softwarehersteller da einen CUDA only Kurs fährt, der wird da vielleicht bald vom Markt abgehängt.
Wohlgemerkt, das gilt im Bereich HPC und Supercomputing, aber auch in "normalen" Servern oder Workstations und Desktops wird durch den Einstieg von Intel wohl mehr mit OpenCL gearbeitet werden, als bisher.
 
Oberst08 schrieb:
Insofern würde ich nicht davon ausgehen, dass man OpenCL weiterhin so stiefmütterlich behandelt, denn über Kurz oder Lang wird Intel mit ihren GPUs da auch einige Marktanteile von NVidia holen.
Oh, OpenCL wird man da weiterhin sehr stiefmütterlich behandeln, weil Intel an ihrer OneAPI arbeitet, die aber auch für AMD zur Zeit optimiert.
 
Hm kann man diese server cpu auch nur mit 4 ram riegel betreiben und wird es dann auch keine Geschwindigkeits einbusungen geben oder wird man das merken oder ist dies von der verwendeten Software abhängig?
 
konkretor schrieb:
Hoffentlich tut sich mal was beim Support von der Software. Läuft ja fast alles auf cuda
Ja vieles läuft auf CUDA bisher, aber das wird sich zumindest bei den National Labs massiv ändern

Oberst08 schrieb:
Insofern würde ich nicht davon ausgehen, dass man OpenCL weiterhin so stiefmütterlich behandelt, denn über Kurz oder Lang wird Intel mit
Doch wird es. Man wird SYCL nutzen als neue gemeinsame Sprache für AMD Intel und nVidia


latiose88 schrieb:
Hm kann man diese server cpu auch nur mit 4 ram riegel betreiben und wird es dann auch keine Geschwindigkeits einbusungen geben oder wird man das merken oder ist dies von der verwendeten Software abhängig?
Du hast halt nur 50% der Speicherbandbreite. Und ob das Performance kostet hängt halt wie immer davon ab was die Software braucht.

Ist wie bei Dualchannel mit einem Dimm oder Quadchannel mit vier dimms.
 
DevPandi schrieb:
Oh, OpenCL wird man da weiterhin sehr stiefmütterlich behandeln, weil Intel an ihrer OneAPI arbeitet, die aber auch für AMD zur Zeit optimiert.
Das Problem ist, dass OpenCL im Vergleich zu Cuda nur wenig Anwender hat. Cuda läuft auf Nvidia GPUs viel schneller als OpenCL. Und Nvidia ist nun Mal marktbeherrschend.

Dass AMD OpenCL wegen OneAPI fallen lässt glaube ich nicht.

So wie ich es verstanden habe, hat AMD in ROCm eine bessere OpenCL-Unterstützung. Aber AMD muss diese wie noch wie viele weitere Funktionen aus ROCm in die Grafiktreiber überführen. Erst wenn diese Funktionen in den Grafiktreibern aufgenommen sind können diese Funktionen relativ einfach verwendet werden

Zur Zeit ist eine der großen Schwächen von ROCm, dass das Installieren und in Gang bekommen nicht trivial ist. Dies spielt für HPC, wo Administratoren die Rechner einrichten keine Rolle. Aber auf der PC-Plattform ist die aktuelle Situation unbefriedigend.

https://rocmdocs.amd.com/en/latest/Programming_Guides/Opencl-programming-guide.html

Der Weg den AMD zur Programmierung favorisiert ist HIP. HIP lehnt sich sehr stark an die Semantik von Cuda an und ermöglich es Programme für Nvidia- und AMD-GPUs zu kompilieren.
https://rocmdocs.amd.com/en/latest/Programming_Guides/Programming-Guides.html
https://github.com/ROCm-Developer-Tools/HIP

Mit HIPIFY bietet AMD ein Tool an, dass bei der Portierung von Cuda-Code nach HIP unterstützt.
https://github.com/ROCm-Developer-Tools/HIPIFY
latiose88 schrieb:
Hm kann man diese server cpu auch nur mit 4 ram riegel betreiben und wird es dann auch keine Geschwindigkeits einbusungen geben oder wird man das merken oder ist dies von der verwendeten Software abhängig?

Auf was willst Du raus Milan-X oder Trento?
Wenn Du ein 8-Kanal-Speicherinteface hast und Du nur 4 Kanäle verwendest, dann hast Du weniger Bandbreite. Da gibt es keine Alternative.

Es gibt sicher Anwendungen bei denen die Speicherbandbreite keine dominante Rolle spielt, aber niemand wird Kanäle, die vorhanden sind nicht nutzen. Auf einem Server kann man eigentlich nie genug Speicher haben.


Einige gehen davon aus dass dieses Diagramm einen Knoten von Frontier zeigt:
1635258380801.png


Wenn dies stimmt wäre CPU Trento und MI INSTINCT MI 250
Lila sind Infinity Fabric 3 Links zwischen den MI Grün sind Infinity Fabric 3 Links zwischen MI und CPU

Wegen den Infinity fabric 3 Links zu den MI benötigt Trento ein neues (Server)IOD, für welche Generation PCIe und DDR stehen weiß ich nicht.
 
ETI1120 schrieb:
Einige gehen davon aus dass dieses Diagramm einen Knoten von Frontier zeigt.

Wenn dies stimmt wäre CPU Trento und MI INSTINCT MI 250
Lila sind Infinity Fabric 3 Links zwischen den MI Grün sind Infinity Fabric 3 Links zwischen MI und CPU

Wegen den Infinity fabric 3 Links zu den MI benötigt Trento ein neues (Server)IOD, für welche Generation PCIe und DDR stehen weiß ich nicht.

Was Du hier mit zum ersten Mal siehst, ist dass das Netzwerk bei den Frontier-Knoten nicht mehr "an" der CPU haengt, sondern aehnlich zu der NVIDIA EGX A100 direkt an den einzelnen GPUs haengt. Der PCIe-Link an der CPU ist mir neu. Bisher war mir nur das Haengen der GPUs am Netzwerk bekannt.

Summit, i.e. der Vorgaenger von Frontier in Oak-Ridge, sollte auch schon eine Reihe an Smart-NIC Features implementiert haben, doch haben IBM & NVIDIA diese am Ende nicht geliefert.

Spekulation:
Ich weiss nicht welche Generation DDR & PCIe verbaut sind, doch waere ich auch nicht verwundert wenn es bereits DDR5 und PCIe 5.0 waere.
 
Zuletzt bearbeitet:
Rockstar85 schrieb:
Ich meinte nicht IBM xD
Dann lass es halt ganz weg; denn nur weil du Intel noch in Klammer dazuschreibst wirds deswegen auch nicht besser.
Demnächst kommen dann wieder diese falsch an den Haaren herbeigezogenen 640kb Sprüche, die auch nicht richtiger werden, nur weils irgendwelche (möchtegern) Schlauberger dauernd wiederholen.
:rolleyes:
 
DevPandi schrieb:
Oh, OpenCL wird man da weiterhin sehr stiefmütterlich behandeln, weil Intel an ihrer OneAPI arbeitet, die aber auch für AMD zur Zeit optimiert.
Also, wenn das Schaubild der Khronos Group bezüglich SYCL stimmt, dann nutzt die OneAPI auch OpenCL für GPUs und FPGAs:
https://www.khronos.org/assets/uploads/apis/2020-05-sycl-landing-page-02_3.jpg
Skysnake schrieb:
Doch wird es. Man wird SYCL nutzen als neue gemeinsame Sprache für AMD Intel und nVidia
SYCL nutzt OpenCL. Der SYCL Compiler kompiliert entweder in OpenCL oder in speziellen Sprachen (z.B. für FPGAs oder Spezial Chips). Insofern läuft es bei SYCL eigentlich auch auf OpenCL hinaus:
https://www.khronos.org/assets/uploads/apis/2020-05-sycl-landing-page-01_3.jpg
 
Zurück
Oben