Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsZu viel fehlerhafter HBM: Nvidia nimmt nur noch getestete Chips von Zulieferern ab
HBM war zwischenzeitlich und ist zum Teil noch bis heute das Zünglein an der Waage für Nvidias AI-Chips. Neue Abnahmeregeln sollen gelten, die strengere Kontrollen vorsehen. Demnach sollen nun alle Chips genauer getestet werden, bevor sie verbaut werden. Dies überrascht zum Teil dennoch.
Da stellen sich mir die Nackenhaare auf wenn ich daran denke wie es eine gute Idee sein kann bei einem Produkt der Margenklasse Gelddruckmaschine auf eine 100% Eingangskontrolle der chips zu verzichten
Ja um Gottes Willen Nvidia..
Ich spreche hier aus persönlicher Berufserfahrung. Im industriellen Halbleiterbereich wird mit Grund nach quasi jedem prozesschritt 100% Kontrolle gefahren weil das mitschleifen kaputter ware viel teurer ist als nach jedem Schritt auszusortieren.
Warum sollte man dort bei der Zusammensetzung der Teile aufhören.
Seit dem Stecker weiß man ja dass Nvidia es nicht so hat mit Grundlagen der technischen Produktion und Spezifikation aber das ist selbst für mich überraschend wie man aus purer Faulheit, Spardruck oder beidem sich solchen Risiken aussetzt und im Zweifelsfall höhere Retouren in Kauf nimmt
Ist sicher geil wenn man hundert tausende Euro investiert und dann ist so ne GPU defekt, ja klar, alles austauschbar aber bei solchen Preise wird eine solche Qualitats Prüfung eigentlich vorausgesetzt. Eigentlich, aber man sieht wie gierig NV ist und jeden Cent sich selber einverleiben will. Halt meine persönliche Meinung dazu.
Vermutlich lag die Testkapazität unter der aktuellen Engpassressource und hätte somit die Produktverfügbarkeit weiter reduziert. Oder es lag tatsächlich einfach an einer kühlen Kosten-/Nutzenechnung, um noch mehr Marge zu machen. Wer weiß..
Ergänzung ()
OldZocKerGuy schrieb:
Ist sicher geil wenn man hundert tausende Euro investiert und dann ist so ne GPU defekt,
Ist sicher geil wenn man hundert tausende Euro investiert und dann ist so ne GPU defekt, ja klar, alles austauschbar aber bei solchen Preise wird eine solche Qualitats Prüfung eigentlich vorausgesetzt.
Niemand investiert so viel in eine kaputte GPU. Du kannst davon ausgehen, dass Nvidia schon jetzt das Endprodukt vor Auslieferung testet, denn RMA-Fälle für so teure Chips will auch Nvidia nicht abwickeln müssen.
Und dann ist es eine Kostenfrage. Solange die Ausschussquote der Speicherchips niedrig genug ist, ist es finanziell sinnvoller, nur am Ende zu testen. Erst wenn zu viele gelieferte Chips kaputt sind, lohnt sich die extra Prüfung.
Um was es geht, ist das der Defekt erst nach der Produktion des Produktes festgestellt wird (woher auch immer) und damit Mehr Kosten verursacht weil dann nicht nur der Chip sondern das ganze Gerät betrifft.
Um was es geht, ist das der Defekt erst nach der Produktion des Produktes festgestellt wird (woher auch immer) und damit Mehr Kosten verursacht weil dann nicht nur der Chip sondern das ganze Gerät betrifft.
Mehr Kosten verursacht es erst dann, wenn die Ausschussrate der Speicherchips mehr Kosten verursacht als die Tests, um das zu verhindern. Das ist genau die (sinnvolle) finanzielle Abwägung die Nvidia hier treffen musste.
Und ganz offensichtlich war das früher eben kein Problem, sonst hätte Nvidia ja Geld zum Fenster rausgeworfen. Das tut Ngreedia definitiv nicht.
Ja bei klassischen DRAM und NAND ist das nicht halt nicht nötig. Wenn da am Ende mal nen Chip defekt ist, dann haust halt das Modul, welches 50 Cent in der Produktion kostet, weg. DRAM-Chips sind aber auch weit weniger komplex und die Yield vermutlich bei 99,9% oder so, HBM ist sowas von eine andere Liga. Natürlich wird da in der Produktion auch zwischendurch gescreened und grobes Testen gemacht, nur scheint dann ein finaler Test zu fehlen. Bei DRAM/NAND dürfte das grobe Screening eben ausreichen.
Vor zwei Jahren bei Intel zu den Meteor-Lake-Tech-Events und dem Packagin-Krams in Malaysia hatte ich mich auch noch gewundert, das man das nicht immer so macht .. das es nun 2025 bei Nvidia sein soll, hätte ich auch nicht gedacht
Naja, ist in vielen Bereichen so, dass man auf 100 % Testungen verzichtet. Kann eben Taktzeit kosten, aber garantiert Investitions- und Wartungskosten. Dann kommt ein BWLer und rechnet das eben durch, welcher Nutzen höher ist. Du kannst davon ausgehen, dass anscheinend davor die VRAM Chips nicht getestet worden sind, wenn sie dies nun machen werden.
PS828 schrieb:
Das schöne ist das Testequipment dazu ist im gesamten Kontext nichtmal teuer.
Weißt du wie man das bei HBM Chips macht? Einfache Kontaktierung und dann einmal / mehrmals vorschreiben, auslesen und dann schauen, ob Daten soweit korrekt?
Che-Tah schrieb:
Das hängt man in der Regel doch als 1. dem Lieferanten um.
Lieferant liefert das, was vertraglich bestellt worden ist. Möchte man eine 100 % Prüfung der Chips haben, darf man die 100 % Prüfung der Chips bezahlen.
Weißt du wie man das bei HBM Chips macht? Einfache Kontaktierung und dann einmal / mehrmals vorschreiben, auslesen und dann schauen, ob Daten soweit korrekt?
Das wird ein multipin prober sein der an dafür vorgesehenen Stellen alle Spannungs und Arbeitslevel ausliest und dann mit einem entsprechenden Netzwerkanalysegerät die Frequenzen misst und evtl Störungen aufdeckt.
Also einfach auflegen und dann über pins kontaktieren, Übergänge rauskalibrieren an einem dummy vorher natürlich.. aber das sind automatische Systeme. Wie lange sowas pro Teil dauert mag ich jetzt nicht zu schätzen aber da es wirklich jeder irgendwie irgendwo macht kanns nicht lange dauern. ^^
Wie Volker schreibt, bei einfacherem Speicher ist es ja nicht nötig. Anscheinend hat HBM erst jetzt die Komplexität erreicht, dass das wirklich nötig wird. Irgendwo ist halt die Grenze, und jetzt wissen wir ungefähr wo.