News AMD-Gerüchte: Eine Radeon RX 9070 XT mit 32 GB für AI soll folgen

SFFox schrieb:
Bevor hier die üblichen Kommentare kommen mit 20/24GB wären auch gut/ausreichend... macht euch mal schlau darüber wie dieser Speicher angesprochen wird (Speicher-Bus, hier wahrscheinlich 256-bit für 16GB).

In short:
Man kann den Speicherbus bei einem Chip in Vollausbau-Stufe nicht vergrößern, sondern nur Teilbereiche deaktivieren. Die Chips mit doppelter Kapazität über den gleichen Bus (quasi "Leitungen") anzubinden ist die einzige Möglichkeit ohne gleichzeitig die eigene Speicherbandbreite zu verkrüppeln.
Für 12GB müsste man den Bus auf 192-bit beschränken, um dann mit doppelter Kapazität auf 24GB zu kommen. Das wäre dann zwar mehr Speicher, aber 25% langsamer in der Datenrate bei gleichem Takt.

Die RX7900XTX hatte ein 384-bit Speicher-Interface, hier ist 24GB genau so angebunden mit Chip pro Bit, wie in der RX9070 die 16GB angebunden sein werden.
Das Gilt auch für Nvidia. Eine Grafikkarte lässt sich nicht mit beliebig viel RAM ausstatten/neu releasen, wenn der Chip einmal fertig ist und ein x-bit breites Speicherinterface vorgibt.
Es gäbe zwei weitere Möglichkeiten für 24GiB: 3GiB-GDDR6-Chips nutzen, wie es sie für GDDR7 gibt. Gibt es für GDDR6 aber nicht. Oder Clamshell mit gemischtem Aufbau aus 2GiB-Chips auf der einen Seite und 1GiB-Chip auf der anderen Seite nutzen. Ein solcher Aufbau wird allerdings langsamer, wenn man dann allen Speicher auch tatsächlich braucht; ist also nicht sonderlich empfehlenswert.
 
  • Gefällt mir
Reaktionen: SFFox
MSI-MATZE schrieb:
Schade das AMD keine 9090xtx auf den Markt bringt und somit sich das Blatt wenden könnte
so wie damals mit AMD und Intel.

wäre der beste Zeitpunkt dafür
Der beste Zeitpunkt ist eben leider jener, zu dem AMD ein High-End-Produkt auch sinnvoll und konkurrenzfähig umsetzen kann, ohne dass es unwirtschaftlich ist. Irgendeinen dieser Faktoren konnte AMD mit seinem Multi-Chip-Ansatz wohl auch diesmal nicht wie gewünscht erfüllen. Wäre das jedoch anders gewesen, ist es nicht ausgeschlossen, dass auch Nvidia sich mehr Mühe gegeben hätte. Diese Generation ist sozusagen im Konsens zwischen beiden eine ziemlich lahme ^_^
 
  • Gefällt mir
Reaktionen: ReVan1199 und Alexander 65
PS828 schrieb:
Das wird dann offensichtlich die Radeon pro der serie die hatten immer doppelten (ECC) VRAM und Vollausbau. Wie die 9070XT also nur mit mehr RAM.

Wäre durchaus auch eine feine Karte für mich. Nicht für AI.. aber für resolve und Konsorten ;) wenn der Preis stimmt Nehm ich sogar zwei
Aufpreis zur regulären Gamer Karte soll bei etwa 265 € liegen. Also die kleinere Karte soll ja um die 500 bis 600 € Kosten. Somit werden wir bei 865 vielleicht auch 900 €. Ich würde sogar bis 1100 € gehen. Falls sie vergleichbar mit einer RTX 4080/5080 sein sollte.

Die GeForce Karte soll ja ab nächsten Jahr, schätze ich mal, dann auch mit 24 GB kommen.
Die Radeon Pro Version kommt aber voraussichtlich schon ab Juni diesen Jahres. Und die Radeon 9070 XT soll ja im Bereich der 4080 S liegen.

Alles in allem sind das wirklich sehr interessante Neuigkeiten. Weil ich mir jetzt noch eine XTX holen wollte. Gerade wegen ihres größeren Speichers.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: PS828
the_IT_Guy schrieb:
Wenn explizit für "KI", wäre es dann nicht besser mal richtig einen raus zu hauen und eine 64GB Karte anzubieten? Oder wäre der Mehrwert zu gering, weil doch zu langsam?
Würde sich schon lohnen, aber da wird die Luft halt schon dünner. Trotzdem ist VRAM durch nichts zu ersetzen, um größere Modelle betreiben zu können. Es ist halt technisch nicht umsetzbar mit den verfügbaren GDDR6-Chips, da bleiben 32 GB das Maximum an 256 Bit Busbreite.

Letzten Endes würde das hier eine Karte werden, die vom RAM her die gleichen Modelle wie eine 5090 betreiben kann, aber halt langsamer. Würde dennoch deutlich vor einer am zu kleinen RAM verhungernden 5080 liegen (für Modelle die mehr als 16 GB brauchen). Das kann für diesen Markt schon ein sehr interessantes Produkt werden.

Wenn AMD denn die Softwareunterstützung auf die Reihe kriegt.
 
  • Gefällt mir
Reaktionen: fox40phil, Penman und the_IT_Guy
@SaoJoaoBatista so sehr ich mich auch darauf freue würde ich dennoch erstmal zur Vorsicht mahnen da es aktuell halt nur eine einzige Quelle ist und die üblichen leaker die sehr oft richtig liegen noch nichts dahingehend Durchblicken haben lassen.

Also wer weiß am ende ist das einfach eine getarnte Radeon pro. Werden wir sehen. Aber wenn die kommt bin ich definitiv aus rein Produktiver sicht interessiert
 
  • Gefällt mir
Reaktionen: Cabranium und stefan92x
NDschambar schrieb:
Ich könnte mir vorstellen, dass auch der Chip aufgebohrt wird und es sich um eine Radeon 9070 XTX handeln wird. Würde Sinn machen.
Da lässt sich nichts aufbohren. Der Navi 48 XT ist ein Vollausbau.
 
  • Gefällt mir
Reaktionen: DickesPferd
Quidproquo77 schrieb:
Hoffensichtlich setzt das Nvidia etwas unter Druck eine 5070 mit 18 und eine 5080 mit 24GB zu bringen.
Die RTX 5080 mit 24 GB VRAM wird ganz bestimmt kommen. Es sollen irgendwo Notebooks mit eben so einer Konstellation gesehen worden sein. Ich denke das wird genau dasselbe Spiel, wie schon mit der 4000er Serie, der Ada Lovelace Architektur werden.
 
  • Gefällt mir
Reaktionen: Alexander 65
Ich sag ja, immerhin schafft es AMD ordentlich VRAM zu bringen.

Wenn dann die Karte mit FSR4, Performance grob auf 4080 Level, mehr als ausreichend VRAM für AI und jegliche Games aufwartet, und dazu noch ca. 8/900€ kostet, dann wäre die Karte doch einiges attraktiver als eine 900€+ teure 5070ti und auch als eine 1300€ teure und kaum schnellere 5080?

Bin gespannt ob es so kommt, aber wenn CB darüber informiert, dann scheint da auch was dran zu sein.
 
NDschambar schrieb:
Ich könnte mir vorstellen, dass auch der Chip aufgebohrt wird und es sich um eine Radeon 9070 XTX handeln wird. Würde Sinn machen.
Nein, würde es nicht. Navi 48 wird auf der 9070 XT bereits in vollem Umfang laufen. Eine schnellere Radeon der 9000er Serie wird es nicht geben. Ein Modell mit 32 GB kommt höchstwahrscheinlich als Teil der Radeon Pro-Reihe.
NDschambar schrieb:
In jedem Fall bringt man dann auch bequem ein Reasoningmodell wie DeepSeekR1 bis zu 32B im Speicher unter.

Sehr interessant!
Für AI mit Sicherheit. Für Gaming in der kolportierten Preis- und Leistungsklasse weniger.

SaoJoaoBatista schrieb:
Die RTX 5080 mit 24 GB VRAM wird ganz bestimmt kommen. Es sollen irgendwo Notebooks mit eben so einer Konstellation gesehen worden sein.
Warum "irgendwo"? Die RTX 5090 Laptop ist genau das - eine RTX 5080 mit verändertem Takt und 24 GB VRAM. Entsprechend wird jedes High-End-Laptop der kommenden Generation mit einer solchen Ausstattung auflaufen.
SaoJoaoBatista schrieb:
Ich denke das wird genau dasselbe Spiel, wie schon mit der 4000er Serie, der Ada Lovelace Architektur werden.
Wenn du damit meinst, dass eine solche Karte vermutlich als RTX 5080 Super kommt, stimme ich dir vollends zu.
 

Beispiele für Modelle, die in 32 GB VRAM passen:​


  • DeepSeek-13B: Ein großes Modell, das hervorragend für fortgeschrittene Aufgaben geeignet ist.
  • DeepSeek-20B: Eines der größten Modelle, das für 32 GB VRAM geeignet ist.
  • DeepSeek-30B: Mit Optimierungen (z.B. FP16 oder INT8) könnte auch ein 30-Milliarden-Parameter-Modell in 32 GB VRAM passen.
Das wär schon TipTop ein großes DeepSeek Modell relativ kostengünstig lokal laufen zu lassen :love:
 
  • Gefällt mir
Reaktionen: Tommy64, Alexander 65, the_IT_Guy und eine weitere Person
SaoJoaoBatista schrieb:
Es sollen irgendwo Notebooks mit eben so einer Konstellation gesehen worden sein.
Bedeutet halt nichts, die 3080 20G gabs auch, nur im Labor (und bei Minern) und nicht auf dem freien Markt
 
@bad_sign Er meint die RTX 5090 Laptop, die ganz offiziell vorgestellt ist und definitiv auf einem GB203 mit 24 GB VRAM basiert.
 
  • Gefällt mir
Reaktionen: Alexander 65 und fox40phil
the_IT_Guy schrieb:
Wenn explizit für "KI", wäre es dann nicht besser mal richtig einen raus zu hauen und eine 64GB Karte anzubieten?

stefan92x schrieb:
Würde sich schon lohnen, aber da wird die Luft halt schon dünner. Trotzdem ist VRAM durch nichts zu ersetzen, um größere Modelle betreiben zu können. Es ist halt technisch nicht umsetzbar mit den verfügbaren GDDR6-Chips, da bleiben 32 GB das Maximum an 256 Bit Busbreite.
Kommt durchaus hin. Ich hatte mal eine Zeit lang die Tesla M10 32 GB (Maxwell von 2016!) im Auge. Die gehen auf ebay für 100-200 Euro weg. Da bekommt man eine Menge GDDR5 RAM um mal ein LLM zu betreiben. Natürlich mit Nvidia, weil KI läuft ja auf Nvidia.
Aktuell habe ich den Wissenstand erreicht, dass es ganz gut war, dass ich keine davon bekommen habe, weil auch CUDA sich weiterentwickelt. Die effizienteren LLMs nutzen neuere Features, um speichereffizienter oder schneller zu arbeiten. Mit einer recht alten GPU dürfte man bei sich den rasanten Neuentwicklungen schon sehr bald wieder ärgern, dass die GPU nicht mehr supportet wird.

Es gibt Karten mit 384 Bit Busbreite und mehr RAM, aber wenn du es wirklich ernst meinst, setzt du auf HBM. Mit 4096+ Bit Bandbreite hat man damit einfach wesentlich mehr Durchsatz, der für LLMs einfach benötigt wird. Nachdem es mal die Vega Serie oder die Radeon VII mit HBM von AMD gab, die durchaus interessant waren, wandern wahrscheinlich sämtliche HBM Chips derzeit in die KI Beschleuniger. Und irgendwo hieß es mal, dass Nvidia damit so viel Geld umsetzt, dass sie Gamer gar nicht mehr bedienen müssten.

Für so ein bisschen LLM kann man Gaming GPUs sicherlich gut verwenden, aber ernsthafte, generische LLMs benötigen einfach VRAM ohne Ende. Die kleinen 16 GB LLMs, die man inzwischen von Nvidia als Assistenz bekommt, sind destilliert und z.B. auf das Schreiben von wissenschaftlichen Texten spezialisiert. Das reicht ggfs. aber auch vollkommen aus. Für das Training braucht man ohnehin mindestens doppelt so viel VRAM wie für die Ausführung, wenn ich das richtig im Kopf habe.

Wobei auch kleine Modelle unter 16 GB schon recht kreative Chatbots sein können. Aber so richtig "schlau" werden die Modelle erst mit einem riesigen Kontext und mehr und mehr VRAM.
Dass die Welt unter KI aktuell überwiegend LLMs versteht ist leider Käse. Andere Typen von KI Modellen wie z.B. Moondream2 können auch mit 4 GB eine gute Bilderkennung erreichen. Es kommt natürlich immer darauf an, was man tatsächlich braucht. Wer nur Autos erkennen will, könnte sogar mit einem Raspberry Pi passable Ergebnisse erzielen.

Korrigiert mich, falls ich irgendwo Mist erzählt habe.
 
  • Gefällt mir
Reaktionen: stefan92x
PS828 schrieb:
Das wird dann offensichtlich die Radeon pro der serie die hatten immer doppelten (ECC) VRAM und Vollausbau. Wie die 9070XT also nur mit mehr RAM.
Für ein Pro Karte wären 270$ aufpreis aber sehr wenig. Die w7800 mit 32GB Vram kostet >2000€. Von daher glaube ich eher an ein XTX model
 
  • Gefällt mir
Reaktionen: PS828
joel schrieb:
Alle Grakas unter 16GB VRAM werden (langfristig) Ladenhüter, und glaubt man den Interpretatoren des Elfenbeinturms wird FHD ganz aus der Empfehlung verschwinden.
(Wie ja bereits aus den Gametests ersichtlich.)
Schön wäre es, aber der Glaube daran fehlt mir dann doch ;)
 
heroesgaming schrieb:
@bad_sign Er meint die RTX 5090 Laptop, die ganz offiziell vorgestellt ist und definitiv auf einem GB203 mit 24 GB VRAM basiert.
Lappi ja aber sein zitierter Beitrag sprach von Desktop
Dass das technisch klappt, keine Frage ;)
 
Northstar2710 schrieb:
Für ein Pro Karte wären 270$ aufpreis aber sehr wenig. Die w7800 mit 32GB Vram kostet >2000€. Von daher glaube ich eher an ein XTX model
Da ja AI das neue Schlagwort ist prognostiziere ich als Namen: Radeon AI 9070 XT. Eine Radeon Pro W9070 kann es dann ja immer noch geben, dann mit ECC-RAM statt normalem. Vorstellen könnte ich mir das durchaus, dass AMD diesmal eine Variante mehr bringt (nennen wir die Zielgruppe doch ganz klassisch Prosumer, zwischen der normalen Consumer-Radeon und der professionellen Radeon Pro).
 
  • Gefällt mir
Reaktionen: Northstar2710
the_IT_Guy schrieb:
Wenn explizit für "KI", wäre es dann nicht besser mal richtig einen raus zu hauen und eine 64GB Karte anzubieten?
Du musst auch einen bereich für die Profikarten lassen, da ist gerade 48GB das max . Nvidia(~8000€) AMD (~3000€)
Ergänzung ()

@stefan92x Damit würde aber die 7900XTX nicht mehr gebraucht. und AMD kann die Produktion komplett einstellen. Was natürlich auch geld spart. Oder hätte die 7900XTX noch andere Vorteile gegenüber der 9070xt 32GB? Der Chip selber wird ja in W7900pro noch verbaut.
 
Zurück
Oben