2 x Samsung EVO 870 4 TB nach knapp einem Jahr mit defekten Sektoren

Ja, voll und ganz betroffen.

"Reallocated Sector Count", "Used Reserve Block" und "Runtime Bad Block" zeigen 730 defekte Blöcke, ca. doppelt so viele wie ich sie hatte (und noch habe, die verschwinden ja nicht, werden nur ausgemappt, durch Reservesektoren ersetzt). Das sind alle diese roten Stellen, die Samsung Magician gefunden hat.

Dann haben wir "Uncorrectable Error Count" und "ECC Error Rate", die immer dann stark ansteigen werden, wenn versucht wird, irgendwas aus den 730 defekten Blöcken auszulesen. Dies schlägt grundsätzlich fehl, und diese beiden Fehlerraten steigen im Einklang an.

Also da wirst du keinerlei Probleme haben mit der Garantie bei Samsung, das ist ein Fall wie aus dem Lehrbuch.

Oder du kannst es so machen wie ich: Da sich die Platte mit der neuen Firmware wieder "berappelt", eiskalt noch ein paar Jährchen weiternutzen und dann nach 3-5 Jahren irgendwann mal einen Garantiefall eröffnen bei Samsung und sie ersetzt bekommen. Bisher hatte ich noch keinerlei weitere defekte Dateien. Damals, wo der Fehler auftrat, wollte ich die SSD im Affekt natürlich erstmal auf den Mond schießen. Aber da sie sich seitdem wirklich Tag für Tag erneut bewährt hat und nicht einen einzigen weiteren Bad Block entwickelt hat, nutze ich sie halt noch.
 
@CiTay

Ich vermute, dass wegen den Reservesektoren CDI den Zustand mit "gut" anzeigt. Solange noch genug Reservesektoren vorhanden sind, muss man sich wahrscheinlich keine Sorgen um den NAND machen. Jetzt wäre es freilich interessant zu wissen, ob die 870 wirklich formatiert werden muss, damit die defekten Blöcke ausgemappt werden. Ist dazu was bekannt? Für mein Verständnis wird die Firmware dieses "ausmustern" der defekten Blöcke so oder so durchführen.

Zu dem Ergebnis des full diagnostic scan vom Samsung Magician möchte ich noch schreiben, dass es für mich klar nach einem Softwarefehler aussieht. Nur ca. 1/5 alles Blöcke wird als "rot" (bad) abgezeigt und auch nur am Beginn des gesamten Speichers. Wenn der NAND im Produktionsprozess beschädigt worden wäre, dann würde ich erwarten, dass die defekten Blöcke sich auch per Zufall gleichmäßig über den gesamten Speicher ausbreiten. Danach sieht es hier aber nicht aus! Alle bad blocks sind im ersten Fünftel zu sehen. Es kann gut sein, dass die Firmware hier immer wieder schreibend/lesend auf die gleichen Blöcke zugegriffen hat und diese dadurch langsam aber sicher zerstört hat. Soweit zu meiner Diagnose, was hier vorgefallen ist.
 
Mr.Seymour Buds schrieb:
Jetzt wäre es freilich interessant zu wissen, ob die 870 wirklich formatiert werden muss, damit die defekten Blöcke ausgemappt werden. Ist dazu was bekannt? Für mein Verständnis wird die Firmware dieses "ausmustern" der defekten Blöcke so oder so durchführen.

Ich weiß nicht mehr genau, wie ich es damals gemacht habe, ich weiß nur, dass ich alle Daten restlos runterkopiert habe (bis auf die defekten Dateien, die habe ich gelöscht). Weiß nicht, ob ich dann nochmal Schnellformatiert habe, wahrscheinlich schon. Ich glaube, die defekten Blöcke werden so oder so ausgemappt, ja, aber es kann sein, dass dafür die schadhaften Dateien erstmal gelöscht werden müssen, so dass der Platz unbelegt ist.

Später habe ich dann alle möglichen Dateien wieder draufkopiert mitsamt Prüfsummendateien (QuickSFV als MD5), um zu checken, ob noch irgendwo Fehler kommen, aber seitdem alles wieder sauber.

Mr.Seymour Buds schrieb:
Nur ca. 1/5 alles Blöcke wird als "rot" (bad) abgezeigt und auch nur am Beginn des gesamten Speichers.

Das kann schlicht und einfach daran liegen, dass der Scan kurz darauf abgebrochen ist.
 
@CiTay

Die Samsung 970 Evo ist jetzt erstmal aussortiert, bis ich sie formatiere. Ich mag noch ein paar Tage warten, falls doch noch was auf der SSD liegt, und ich diese Daten ggf. beim Sichern/Kopieren vergessen habe (was ich nicht glaube, aber doch irgendwie möglich sein kann).
Es hat einige Stunden gedauert das OS mit einer annehmbaren Minimalkonfiguration auf der 980pro zu re-installieren. Diese hatte ich vorher auch mit dem Magician tiefen-gescannt und es gab keine fehlerhaften Blöcke auf dem Speicher.

Ich glaube nicht, dass ich die 970 zum Hersteller zurückschicken werde, wenn sie nach der Formatierung wieder funktioniert. Warum sollte ich auch? Es werden halt die Reserveblöcke benutzt und das wars. Alles in allem war es jetzt doch gut, dass der Herstellungsfehler sich bemerkbar gemacht hat, bevor die SSD gar nicht mehr funktioniert hätte bzw. das OS nicht mehr zu starten gewesen wäre.
Ich habe die Neuinstallation auch dazu genutzt die Intel Management Engine Firmware (Version 15.0.45.2411V2) auf dem Mainboard zu updaten und das neuste BIOS/UEFI (für mein Board Version 1903) zu installieren. Jetzt ist jedenfalls wieder alles auf dem neusten Stand. :)
 
  • Gefällt mir
Reaktionen: CiTay
Der SSD ist mittlerweile wieder in Betrieb und funktioniert soweit. Der Samsung Magician zeigt mir "alle Sektoren gut". Mal sehen, ob es auch so bleibt.
 
  • Gefällt mir
Reaktionen: Recharging und CiTay
@Mr.Seymour Buds
Guten Morgen!
Drücke die Daumen. Auf jeden Fall gut im Blick behalten.
Ich hatte seinerzeit immer ein schlechtes Gefühl, da auf der SSD wichtige Daten abgelegt waren - trotz Backups, denn auch das Rückspielen, etc. hätte eine gewisse Ausfallzeit nach sich gezogen (und hier wahrscheinlich immer zum schlechtesten Zeitpunkt).
 
  • Gefällt mir
Reaktionen: Mr.Seymour Buds
Das ungute Gefühl habe ich auch. Mit dem Formatieren, FW Update und ausmappen ist die Sache hoffentlich erledigt. War auch recht teuer, der Speicher, und jetzt sind die Wiederbeschaffungskosten hoch, weil die NAND Preise wieder angezogen haben.
 
  • Gefällt mir
Reaktionen: Recharging
Interessant. Danke für den Link. Ich denke es war klar ein Firmware Schnitzer, den man sich bei Samsung geleistet hat, durch den einzelne Speicherbereiche zu oft beschrieben worden sind ('Kaputtschreiben').

Ich erwarte von Samsung aber nun eigentlich, dass der Magician auch für Linux Betriebssysteme erscheint, damit ich meine Linuxsystem, die ich pflege, auf aktuelle Firmware prüfen kann! Geld dafür haben sie ja genug bei einem der größten Betriebe der Welt.
 
Zuletzt bearbeitet:
Die bekommen reihenweise die Firmware nicht hin, die 870 ist ja beileibe nicht die erste betroffene Serie. Da darfst du nicht auch noch Software für nicht-Standard-Consumer-Hardware erwarten.
 
Hab den Thread gerade erst gesehen und fand's spannend, weil bei mir kürzlich auch gleich 2 4TB 870 EVOs zeitgleich Probleme machten.

Ich weiß leider nicht genau, ab wann die Probleme genau anfingen und wie sich das eventuell entwickelt hat: Ich wollte letzte Woche die beiden SSDs wieder aktiv in Betrieb nehmen, nachdem sie mehrere Monate einfach nur in meinem Serverchen völlig unbenutzt mitgelaufen sind. Unbenutzt deshalb, weil sie noch mit einem Windows Storage Pool belegt waren und eigentlich in einem ZFS Server (Solaris) stecken, der damit also soweit gar nichts anfangen konnte. Als ich sie dann aber endlich mal in einen ZFS Pool einbinden wollte fiel mir auf, dass der Server sie gar nicht mehr als Disks überhaupt (er)kannte. Reboot - physisch im Bios werden sie aufgeführt, aber Solaris weigerte sich weiterhin und dauerhaft hartnäckig.

Also hab ich die mal wieder in ein Windows-System umgezogen. Dort tauchten die Dinger auch im Gerätemanager auf und auch ein Storagepool wurde (als kaputt) erkannt, aber mehr war auch nicht drin. Weder diskpart noch die Datenträgerverwaltung haben die Disks "gesehen". In der powershell tauchten sie auch nur mit "get-physicaldisk" auf, ein "get-disk" listete sie hingegen nicht. Auch der Samsung Wizard sah sie übrigens nicht. Die Ereignisanzeige zeigte auch nur wenig hilfreiche "I/O Fehler".

Ich hab am Ende einen ganzen Tag mit Versuchen verbracht, dem Problem auf die Spur zu kommen, jeder SSD einzeln, beide zusammen, an 4 verschiedenen Rechnern, mit Windows, mit Solaris, mit Linux (Live CD's & Co.) und diversen Partitionierungstools. Nope. Die Dinger blieben quasi tot/unbrauchbar.

Habe dann aufgegeben und aktuell sind'se in der RMA bei Samsung. Schau'mer mal.
 
  • Gefällt mir
Reaktionen: Recharging
Gekauft waren sie Mai 2021. Firmware konnte ich nicht mehr auslesen. Aber die waren halt minimal benutzt. Mal kurz eingebaut und für den Storage-Pool als Steam-Library & Co. benutzt, also auch kein echter Stress für die Dinger ("write once", "read sometimes"). Danach erst länger rumgelegen (danach tauchten sie aber noch im OS auf), dann lange rumgeidled wie beschrieben und dann irgendwann tot.
 
Kurzes Update: die beiden SSDs wurden von Samsung anstandslos getauscht.
 
  • Gefällt mir
Reaktionen: Xairo und Recharging
Meine 8 TB SSD lief ein Jahr super, dann kamen plötzlich CRC_Error_Count Fehler. Partition war weg (ohne Zugriff auf das Laufwerk, einfach so, kein read oder write Zugriff zu der Zeit!). Partition wiederhergestellt, SATA Kabel getauscht, dann noch das Mainboard getauscht, Ports gewechselt, Platte mit dd komplett beschrieben, sah dann irgendwann so aus, als ob neue CRC Fehler nur beim Booten auftauchten - könnte ja ein kosmetisches Problem sein (die Zahl stagniert jetzt scheinbar auch), aber denkste... Der Content der Platte liegt jetzt auf einer weiteren 8 TB SSD (3 davon sind im Server). Die Platte war wieder im System und fiel urplötzlich aus (kein Zugriff als dies passierte) und verschwand vom System. Reboot... SSD wieder da... Bin gespannt was jetzt der Samsung Support macht, wird sicher mühsam weil die Platte ja scheinbar funktioniert bis sie dann irgendwann spontan ausfällt - das hat so ca. 32 Stunden gedauert (wohl gemerkt, in dieser Zeit auch keine Zugriffe, am Anfang nur Ordner erstellt und dann nichts mehr). Ärgere mich jetzt schon, hab damals keine 300 EUR für das Teil bezahlt und jetzt kostet die fast doppelt so viel.

Ach ja, bei mir wurde die Platte recht human genutzt. Selten geschrieben, selten gelesen. Bin schon etwas enttäuscht, dass so ein Teil einfach so per Zufall ausfällt.
 
Xairo schrieb:
Meine 8 TB SSD lief ein Jahr super, dann kamen plötzlich CRC_Error_Count Fehler.
Gab's die EVO wirklich mit 8TB? Dachte 4TB wäre die größte gewesen.

Die QVO war ja von dem Problem nicht betroffen, oder?
 
QVO, ich wollte nur was bzgl. des Fehlers hinzufügen.
Da ja CRC Fehler auf die Verbindung hindeuten, was bei meinem Fall aber definitiv nicht der Fall gewesen ist.
 
Xairo schrieb:
QVO, ich wollte nur was bzgl. des Fehlers hinzufügen.
In diesem Thread gehts doch aber um den Fehler der EVO.

Bei der QVO ist doch noch gar kein systematischer Fehler bekannt, oder hat sich das geändert? Da ich auch eine 8 TB QVO habe, würde mich das schon interessieren.
 
Zurück
Oben