SSD clonen mit Clonezilla fehlgeschlagen: bad sectors

muzik · 17. März 2014

So weiter gehts:
Ich habe jetzt endlich hinbekommen die nfi.exe dazu zu überreden Daten auszuspucken. Der Trick bei mir lag komischer Weise darin die Doppelpunkte beim Laufwerksbuchstaben weg zu lassen.

Resultat:
Anmerkungen in orange

Test-File:
C:\Windows\system32>D:\Downloads\Windows_testprogs\nfi\nfi.exe C 2000000
NTFS File Sector Information Utility.
Copyright (C) Microsoft Corporation 1999. All rights reserved.

***Logical sector 2000000 (0x1e8480) on drive C is in file number 16753.
\Windows\Fonts\meiryo.ttc
$STANDARD_INFORMATION (resident)
$FILE_NAME (resident)
$FILE_NAME (resident)
$DATA (nonresident)
logical sectors 1999576-2018199 (0x1e82d8-0x1ecb97)

Clonezilla: "can’t read sector 32776228352, lost data"
C:\Windows\system32>D:\Downloads\Windows_testprogs\nfi\nfi.exe C 32776228352
NTFS File Sector Information Utility.
Copyright (C) Microsoft Corporation 1999. All rights reserved.

***Logical sector 32776228352 (0x7a19d8e00) on drive C is not in any file.

Clonezilla: "can’t read sector 64552631808, lost data"
C:\Windows\system32>D:\Downloads\Windows_testprogs\nfi\nfi.exe C 64552631808
NTFS File Sector Information Utility.
Copyright (C) Microsoft Corporation 1999. All rights reserved.

***Logical sector 64552631808 (0xf07a2fe00) on drive C is not in any file.

Clonezilla: "can’t read sector 69473664512, lost data"
C:\Windows\system32>D:\Downloads\Windows_testprogs\nfi\nfi.exe C 69473664512
NTFS File Sector Information Utility.
Copyright (C) Microsoft Corporation 1999. All rights reserved.

***Logical sector 69473664512 (0x102cf3fe00) on drive C is not in any file.

Clonezilla: "can’t read sector 82821266944, lost data"
Der Befehl "82821266944" ist entweder falsch geschrieben oder
konnte nicht gefunden werden.

C:\Windows\system32>D:\Downloads\Windows_testprogs\nfi\nfi.exe C 82821266944
NTFS File Sector Information Utility.
Copyright (C) Microsoft Corporation 1999. All rights reserved.

***Logical sector 82821266944 (0x1348883e00) on drive C is not in any file.

Kurzum: Keiner der fragwürdigen Sektoren gehört zu einer Datei.

Meine Schlussfolgerung: Die geklonte Partition müsste uneingeschränkt lauffähig sein, da Datenverlust nur an Stellen auftrat, an denen garkeine Daten lagen. Oder?

Was ich jetzt gerade überhaupt nicht zuordnen kann: Was bedeutet das jetzt für die M4? Sind da nun wirklich Sektoren kaputt? Bzw. wie ist diese jetzt zu bewerten?

Ergänzung (17. März 2014)

Tatsächlich bootet die M500 eingebaut in den PC einwandfrei. Es gab keine Probleme.

Bleibt die Frage nach eurer Einschätzung und der Frage nach dem Zustand der M4.

Holt · 18. März 2014

Das bedeutet für die m4, dass diese Sektoren nicht auf gültige LBAs gemappt sind. Beschreibe deren freie Kapazität mal z.B. mit h2testw, auch wenn man das laut heise nicht für das Systemlaufwerk verwenden soll, wähle einfach ein paar GB weniger und prüfen dann, ob diese Cluster jetzt einem *.h2w File zugeordnet sind, dann sollten sie neu und auf gültige Adressen gemappt werden. Du siehst ja dann bei h2testw ob es Lesefehler gibt.

muzik · 18. März 2014

Habe jetzt mit h2testw alles bis auf 2Gb vollgeschrieben (die Schreibrate bricht da dann bei der M4 ganz schön ein).
Resultat: Alle Sektoren von vorher sind weiterhin keiner Datei zuzuordnen. Es hat sich also nichts verändert.

Ergänzung (18. März 2014)

Ich möchte anmerken, dass die M4 formatiert werden soll bevor sie weiterverwendet wird. Da ich sie bereits funktionstüchtig auf die neue M500 geklont habe, hätte ich nichts dagegen die M4 zu formatieren etc.
Nur falls das helfen würde bei der Fehlersuche.

Rumo · 18. März 2014

Dann mach ein secure erase oder kompletter TRIM (unter Linux mit blkdiscard).

Und gute Backups, für was auch immer du die SSD in Zukunft einsetzt.

muzik · 18. März 2014

Rumo schrieb:
Dann mach ein secure erase oder kompletter TRIM (unter Linux mit blkdiscard).

Und gute Backups, für was auch immer du die SSD in Zukunft einsetzt.

Das ist mir zu lapidar. Ich habe jetzt dank Holts und deiner Hilfe bereits einiges herausgefunden, was diesen "Generalverdacht" gegenüber der M4, den du formulierst, nicht unbedingt stützt.
Hätte ich die M4 unter "Generalverdacht" weiternutzen wollen, hätte ich schon früher aufhören können.
Gute Backups sind immer gut und wichtig. Ich möchte jetzt aber erstmal wissen, ob die M4 tatsächlich in irgendeiner Weise "verdächtig" ist.
Bis jetzt weiß ich nur, dass auf den vermeintlich defekten Sektoren garkeine Daten liegen. Es könnte natürlich sein, dass diese Sektoren alle in den letzen 2 Gb liegen, die ich nicht vollgeschrieben habe.

Ergänzung (18. März 2014)

Editiert: "...dank Holts und deiner Hilfe..." natürlich. Sorry.

Ich möchte die SSD in einem Laptop als Systemplatte weiterverwenden. Deshalb interessiert mich schon, ob sie "verdächtig" ist, oder ob man hier eher woanders den Schuldigen findet.

Holt · 18. März 2014

Wenn diese Cluster nicht von den Dateien von h2testw überschrieben wurden, dann war das natürlich umsonst, oder hast Du die h2w Dateien erst gelöscht und dann getestet? Dann wäre das natürlich klar. Hat h2testw einen Lesefehler ausgegeben?

Ein Secure Erease wäre ein gute Möglichkeit, da dabei auch die ganze Indirection Table gelöscht wird, so dass auch die Fehler weg sein werden. Ansonsten ist das Problem aber auch nicht mehr kritisch, da diese Sektoren sowieso normalerweise nicht gelesen werden, bevor sich nicht sowieso vorher wieder beschrieben wurden. Die SSDs weiter zu verwenden sollte kein Problem sein, da sie ansich in Ordnung ist, das sollte h2testw ja auch gezeigt haben.

Rumo · 18. März 2014

muzik schrieb:
was diesen "Generalverdacht" gegenüber der M4, den du formulierst, nicht unbedingt stützt.

Jeder malt sich die Welt so wie es ihm passt. Ein Speichermedium darf keine Lesefehler produzieren - egal ob dort Daten liegen oder nicht. Das ist auch bei einer SSD einfach nicht normal. Bestenfalls ist es ein Firmware-Bug, schlimmstenfalls ein Hardwarefehler. Jedenfalls stimmt da was nicht, anders ist ein Lesefehler nicht zu interpretieren.

muzik schrieb:
Es könnte natürlich sein, dass diese Sektoren alle in den letzen 2 Gb liegen, die ich nicht vollgeschrieben habe.

Wenn du die genauen Sektornummern hast, kannst du die mit dd direkt beschreiben:

Code:

dd if=/dev/urandom of=/dev/ssd bs=<sektorgröße> seek=<sektornummer> count=1

<sektorgröße> ist dabei z.B. 512 oder 4096

<sektornummer> eben die dir bekannte Nummer des Sektors. Wenn du einen etwas größeren Bereich schreiben willst kannst du auch sektornummer-4 nehmen und dann count=8.

Man kann auch mit badblocks bestimmte Regionen testen.

Code:

badblocks -w -b <sektorgröße> /dev/ssd <sektornummer-ende> <sektornummer-anfang>

muzik schrieb:
Deshalb interessiert mich schon, ob sie "verdächtig" ist, oder ob man hier eher woanders den Schuldigen findet.

Ist unwahrscheinlich da bei Kabel/Controller-Problemen eher nicht immer die gleichen Sektoren betroffen sind.

muzik · 18. März 2014

Holt schrieb:
Wenn diese Cluster nicht von den Dateien von h2testw überschrieben wurden, dann war das natürlich umsonst, oder hast Du die h2w Dateien erst gelöscht und dann getestet? Dann wäre das natürlich klar. Hat h2testw einen Lesefehler ausgegeben?

h2testw hat keine Fehler ausgegeben.
Ich habe natürlich die Sektoren geprüft, als die Platte nahezu vollgeschrieben war.
Ich hatte 2Gb freigelassen. Es könnte natürlich sein, dass die Sektoren genau in diesen 2Gb lagen.

Holt schrieb:
Ein Secure Erease wäre ein gute Möglichkeit, da dabei auch die ganze Indirection Table gelöscht wird, so dass auch die Fehler weg sein werden. Ansonsten ist das Problem aber auch nicht mehr kritisch, da diese Sektoren sowieso normalerweise nicht gelesen werden, bevor sich nicht sowieso vorher wieder beschrieben wurden. Die SSDs weiter zu verwenden sollte kein Problem sein, da sie ansich in Ordnung ist, das sollte h2testw ja auch gezeigt haben.

Das heißt es würde im Falle von wirklich defekten Sektoren irgendwann zu sichtbaren Schreibfehlern kommen, die man dann entweder bemerken würde, oder in den SMART-Werten sehen würde.
Welche Erklärung gäbe es denn nun für diese angeblich defekten Sektoren? (sagen wir, sie liegen nicht in den letzten 2 Gb - wo, bzw. was sind sie dann?)

Ergänzung (18. März 2014)

@Rumo
toller Tipp, wird sofort versucht.

Ergänzung (18. März 2014)

Rumo schrieb:
Wenn du die genauen Sektornummern hast, kannst du die mit dd direkt beschreiben:

Code:

dd if=/dev/urandom of=/dev/ssd bs=<sektorgröße> seek=<sektornummer> count=1

<sektorgröße> ist dabei z.B. 512 oder 4096

<sektornummer> eben die dir bekannte Nummer des Sektors. Wenn du einen etwas größeren Bereich schreiben willst kannst du auch sektornummer-4 nehmen und dann count=8.

Hab ich gemacht. Resultat bei allen dasselbe:
folgendes Resultat ist quatsch. Es hätte "/dev/sda" statt "/dev/sdd" heißen müssen, siehe unten richtiges Ergebnis.

Code:

root@debian:/home/user# dd if=/dev/urandom of=/dev/sdd bs=512 seek=69473664512 count=1
1+0 records in
1+0 records out
512 bytes (512B) copied, 0.0177837 s, 28.8 kB/s

Was heißt das? Scheint zu funktionieren, oder?
_

Rumo schrieb:
Man kann auch mit badblocks bestimmte Regionen testen.

Code:

badblocks -w -b <sektorgröße> /dev/ssd <sektornummer-ende> <sektornummer-anfang>

Habe ich nicht hinbekommen. Es kommt Folgendes:

Code:

root@debian:/home/user# badblocks -w -b 512 /dev/sdd 32776228351 32776228353
badblocks: invalid last block - 32776228351

Rumo · 18. März 2014

badblocks hat da völlig recht, die Sektornummern sind einfach keine... 32776228351*512 wären 15TB.

In deinen Screenshots auf Seite 1 waren das doch deutlich kleinere Zahlen, wie bist du dann auf diese riesigen Nummern gekommen? Damit ist das Ergebnis der vorhergegangenen Befehle natürlich auch nichtig, daß bei 15TB keine Datei liegen kann ist ja klar

Wieso dd keine Fehlermeldung gebracht hat verstehe ich dann allerdings auch nicht. Es sei denn /dev/sdd hat gar nicht existiert.

Code:

# dd if=/dev/urandom of=/dev/sdxyz bs=512 seek=69473664512 count=1
1+0 records in
1+0 records out
512 bytes (512 B) copied, 0.000115432 s, 4.4 MB/s
# ls -alh /dev/sdxyz
-rw-r--r-- 1 root root 33T Mar 18 19:19 sdxyz

muzik · 18. März 2014

hmm stimmt.

Also das in dem Screenshot im ersten Post ist Clonezilla ohne -rescue. Es hat diesen Fehler/screenshot ausgegeben und hat abgebrochen.
Danach habe ich Clonezilla mit -rescue ausgeführt und habe aufm laptop die angezeigten Data-losts mitgeschrieben. Das sind die "großen Nummern".

Code:

can’t read sector 32776228352, lost data
can’t read sector 64552631808, lost data
can’t read sector 69473664512, lost data
can’t read sector 82821266944, lost data

So sahen die error-messages bei Clonezilla mit -rescue aus. Die kamen allerdings einzeln während dem laufenden Prozess.

Außer diesen 4 Sektoren hat Clonezilla mit -rescue nichts ausgegeben.

Ergänzung (18. März 2014)

Habe den Sektor aus dem Screenshot im ersten Post mal mit nfi.exe überprüft und das ist ein irgendein Windows-file.
Der Sektor 64222914 aus dem ersten Screenshot trat aber beim durchführen von Clonezilla -rescue nicht auf. Eventuell konnte dieser von der -rescue-Funktion doch irgendwie ausgelesen werden, was Clonezilla ohne Rescue nicht hinbekommen hat und deswegen bei diesem Sektor abgebrochen hat?

Auch komisch, dass Clonezilla so komische Sektoren überhaupt ausgegeben hat?

Rumo · 18. März 2014

mach mal ein smartctl -t long /dev/ssd (vorher ggf. apt-get install smartmontools)

und dann wenn das fertig ist (viertelstunde später oder so) smartctl -a /dev/ssd

/dev/ssd natürlich zu ersetzen durch den richtigen Gerätenamen, (steht auch beim smartctl -a dabei).

Vielleicht sind die Lesefehler ja inzwischen ja auch weg, du hast ja schon viel überschrieben... der SMART-Selbsttest sollte dann ohne Fehler durchlaufen und dann bleibt eh nur C&C

muzik · 18. März 2014

Ich hatte den Laufwerknamen falsch ersetzt!

Code:

root@debian:/home/user# dd if=/dev/urandom of=/dev/sda bs=512 seek=69473664512 count=1
dd: '/dev/sda': cannot seek: Invalid argument
0+0 records in
0+0 records out
0 bytes (0 B) copied, 0.023203 s, 0.0 kB/s

Das ist die korrekte Ausgabe bei allen 4 Sektoren. Was auch Sinn macht, da diese Sektoren ja garnicht auf der Platte liegen.

Rest kommt gleich
.
.
.

Ergänzung (18. März 2014)

So habs jetzt via Fotos gelöst.

Hier jetzt der erste Teil des Ergebnisses. Sagt bescheid, falls ihr den zweiten Teil auch benötigt.

Interessant finde ich:

Code:

Warning: ATA error count 0 inconsistent with error log pointer 4

Ergänzung (18. März 2014)

Argh, der rest des Logs wäre schon wichtig. Aber wie bekomme ich sinnvoll den Output in eine Textdatei? Ich starte ja Clonezilla (ein debian-derivat) vom USB-Stick. Kann ich damit den Output einfach in eine Textdatei in einem meiner Verzeichnisse auf C:, bzw auf der SSD erstellen und dann Windows starten und die Datei dann lesen & hier posten?
Immerhin ist die Tabelle schonmal komplett drauf.

Rumo · 18. März 2014

smartctl -a | pastebinit

muzik · 18. März 2014

Cool. Jetzt kann ich das grad nicht mehr ausprobieren, poste morgen das ganze ergebnis.

Holt · 19. März 2014

muzik schrieb:
Danach habe ich Clonezilla mit -rescue ausgeführt und habe aufm laptop die angezeigten Data-losts mitgeschrieben. Das sind die "großen Nummern".

Code:

can’t read sector 32776228352, lost data can’t read sector 64552631808, lost data can’t read sector 69473664512, lost data can’t read sector 82821266944, lost data

So sahen die error-messages bei Clonezilla mit -rescue aus. Die kamen allerdings einzeln während dem laufenden Prozess.

Außer diesen 4 Sektoren hat Clonezilla mit -rescue nichts ausgegeben.

Selbst wenn das LBAs wären, liegen die alle weit außerhalb des Adressbereiches der SSD, wäre es Clusternummer dann erst recht. Kann es ein Fehler in den Verwaltungsdaten des Filesystems gegeben haben und Clonezilla hat versucht diese nicht existierenden Sektoren auszulesen, was dann auch nur mit einem Lesefehler enden konnte? Lese doch einfach mal die ganze SSD aus und schau ob es wirklich noch Fehler gibt, das geht einfach mit dd if=/dev/sda of=/dev/null

muzik · 19. März 2014

So hier erstmal das smartctl-Ergebnis.
Das war garnicht so einfach. Ich hatte Clonezilla (debian) in den Ram geladen, weshalb das alles nicht funktionierte. Zumindest habe ich es nicht hinbekommen neue Pakete zu installieren. Habe jetzt ne vernuenftige Linux-Distribution, Lubuntu.
Habe jetzt auch hinbekommen mit pastebinit alles auszugeben. Vielen Dank fuer den Hinweis.

Also hier erstmal der smartctl:

Link: http://paste.ubuntu.com/7119560/
Ich weiß nicht wie lange der gültig ist, dehalb hier nochmal als code:

Code:

smartctl 6.2 2013-04-20 r3812 [x86_64-linux-3.11.0-12-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, [url]www.smartmontools.org[/url]

=== START OF INFORMATION SECTION ===
Model Family:     Crucial/Micron RealSSD m4/C400
Device Model:     M4-CT128M4SSD2
Serial Number:    000000001138031A668F
LU WWN Device Id: 5 00a075 1031a668f
Firmware Version: 0309
User Capacity:    128,035,676,160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed Mar 19 12:37:39 2014 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x85)	Offline data collection activity
					was aborted by an interrupting command from host.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 119)	The previous self-test completed having
					the read element of the test failed.
Total time to complete Offline 
data collection: 		(  595) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (   9) minutes.
Conveyance self-test routine
recommended polling time: 	 (   3) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   050    Pre-fail  Always       -       0
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   100   100   001    Old_age   Always       -       5599
 12 Power_Cycle_Count       0x0032   100   100   001    Old_age   Always       -       1450
170 Grown_Failing_Block_Ct  0x0033   100   100   010    Pre-fail  Always       -       0
171 Program_Fail_Count      0x0032   100   100   001    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   001    Old_age   Always       -       0
173 Wear_Leveling_Count     0x0033   098   098   010    Pre-fail  Always       -       75
174 Unexpect_Power_Loss_Ct  0x0032   100   100   001    Old_age   Always       -       1
181 Non4k_Aligned_Access    0x0022   100   100   001    Old_age   Always       -       9748 429 9318
183 SATA_Iface_Downshift    0x0032   100   100   001    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   050    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   001    Old_age   Always       -       3890
188 Command_Timeout         0x0032   100   100   001    Old_age   Always       -       0
189 Factory_Bad_Block_Ct    0x000e   100   100   001    Old_age   Always       -       106
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       0
195 Hardware_ECC_Recovered  0x003a   100   100   001    Old_age   Always       -       738
196 Reallocated_Event_Count 0x0032   100   100   001    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   001    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   001    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   001    Old_age   Always       -       0
202 Perc_Rated_Life_Used    0x0018   098   098   001    Old_age   Offline      -       2
206 Write_Error_Rate        0x000e   100   100   001    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 0
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 0 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 08 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 03 08 c0 f6 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 10 00 e0 f6 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  34d+08:28:50.816  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  34d+08:28:50.816  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  34d+08:28:50.816  IDENTIFY DEVICE

Error -1 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 00 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 03 00 e0 f5 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 10 00 e0 f4 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f3 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f2 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f1 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED

Error -2 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 08 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 03 08 c0 f6 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 10 00 e0 f6 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  34d+08:28:50.816  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  34d+08:28:50.816  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  34d+08:28:50.816  IDENTIFY DEVICE

Error -3 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 00 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 03 00 e0 f5 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 10 00 e0 f4 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f3 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f2 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f1 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED

Error -4 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 08 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 d0 08 c0 f6 d3 40 00  34d+08:18:50.816  READ FPDMA QUEUED
  60 d8 00 e0 f6 d3 40 00  34d+08:18:50.816  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  34d+08:18:50.816  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  34d+08:18:50.816  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  34d+08:18:50.816  IDENTIFY DEVICE

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       70%      5598         64222912
# 2  Vendor (0xff)       Completed without error       00%      5597         -
# 3  Extended offline    Completed: read failure       70%      5595         64222912
# 4  Extended offline    Completed: read failure       70%      5585         64222912
# 5  Extended offline    Completed: read failure       70%      5584         64222912

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Ergänzung (19. März 2014)

So hier das Ergebnis des dd-Ausleseversuchs:

Code:

lubuntu@lubuntu:~$ sudo dd if=/dev/sda of=/dev/null
dd: reading ‘/dev/sda’: Input/output error
64222912+0 records in
64222912+0 records out
32882130944 bytes (33 GB) copied, 82.4436 s, 399 MB/s

Auch hier wieder 64222912 (derselbe Sektor wie im Screenshot im ersten Post). Siehe Smart Self-test log, auch da steht er drin.

Was aber interessant ist, ist, dass "Current_Pending_Sector = 0" ist. Alle Fehleranalysen, die ich mir angesehen habe beziehen sich auf Current_Pending_Sector, als Indikator von nicht lesbaren, aber beschriebenen Sektoren. Auch die Problemlösungen basieren immer darauf zu überschreiben oder irgendwie anders eine "reallocation" zu provozieren. Ob es geklappt hat, sieht man dann an den "Current_Pending_Sector = 0".
In meinem Fall ist der Current_Pending_Sector aber von vornherein = 0 - trotzdem gibt es diese Fehlerhaften Sektoren.

Kann sich jemand darauf einen Reim machen?

Ergänzung (19. März 2014)

Hier noch was nfi.exe für den Sektor 644222912 sagt:

Code:

C:\Windows\system32>D:\Downloads\Windows_testprogs\nfi\nfi.exe c 64222912
NTFS File Sector Information Utility.
Copyright (C) Microsoft Corporation 1999. All rights reserved.


***Logical sector 64222912 (0x3d3f6c0) on drive C is in file number 500142.
\PROGRA~3\MICROS~1\Search\Data\APPLIC~1\Windows\Windows.edb
    $DATA (nonresident)
        logical sectors 77950520-77950727 (0x4a56e38-0x4a56f07)
        logical sectors 88460192-88476607 (0x545cba0-0x5460bbf)
        logical sectors 143935480-143937415 (0x89447f8-0x8944f87)
        logical sectors 102986880-102991215 (0x6237480-0x623856f)
        ...
        ...
        ... von denen kamen noch einige Reihen... falls interessant, bitte sagen, dann poste ich die auch noch.

Ansonsten zeigen alle Tests irgendwie immer nur den "ersten fehlerhaften Sektor". Ich würde aber gerne alle sehen.

Rumo · 19. März 2014

Falls innerhalb der Garantiezeit: umtauschen. Read failure im Smart Self-Test sollte als Begründung reichen.

muzik · 19. März 2014

Die Platte ist 2 oder 3 Jahre alt. Ich glaube nicht dass da noch Garantie drauf ist.
Was zieht ihr denn für einen Schluss aus den Daten?
Kann ich irgendwas ändern, remappen etc.?

Holt · 20. März 2014

Mache doch einfach ein Secure Erease und prüfen dann mit dd noch mal, ob alle Sektoren ausgelesen werden können, wenn nicht kannst Du die SSD ja immer noch tauschen oder ausrangieren.

muzik · 20. März 2014

Holt schrieb:
Mache doch einfach ein Secure Erease und prüfen dann mit dd noch mal, ob alle Sektoren ausgelesen werden können, wenn nicht kannst Du die SSD ja immer noch tauschen oder ausrangieren.

gesagt getan, secure erase und dann:

Code:

lubuntu@lubuntu:~$ sudo dd if=/dev/sda of=/dev/null
250069680+0 records in
250069680+0 records out
128035676160 bytes (128 GB) copied, 248.835 s, 515 MB/s

smartctl:

Code:

=== START OF INFORMATION SECTION ===
Model Family:     Crucial/Micron RealSSD m4/C400
Device Model:     M4-CT128M4SSD2
Serial Number:    000000001138031A668F
LU WWN Device Id: 5 00a075 1031a668f
Firmware Version: 0309
User Capacity:    128,035,676,160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Mar 20 20:20:48 2014 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  595) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (   9) minutes.
Conveyance self-test routine
recommended polling time: 	 (   3) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   050    Pre-fail  Always       -       0
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   100   100   001    Old_age   Always       -       5608
 12 Power_Cycle_Count       0x0032   100   100   001    Old_age   Always       -       1451
170 Grown_Failing_Block_Ct  0x0033   100   100   010    Pre-fail  Always       -       0
171 Program_Fail_Count      0x0032   100   100   001    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   001    Old_age   Always       -       90
173 Wear_Leveling_Count     0x0033   098   098   010    Pre-fail  Always       -       76
174 Unexpect_Power_Loss_Ct  0x0032   100   100   001    Old_age   Always       -       1
181 Non4k_Aligned_Access    0x0022   100   100   001    Old_age   Always       -       9749 430 9319
183 SATA_Iface_Downshift    0x0032   100   100   001    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   050    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   001    Old_age   Always       -       3894
188 Command_Timeout         0x0032   100   100   001    Old_age   Always       -       0
189 Factory_Bad_Block_Ct    0x000e   100   100   001    Old_age   Always       -       106
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       0
195 Hardware_ECC_Recovered  0x003a   100   100   001    Old_age   Always       -       738
196 Reallocated_Event_Count 0x0032   100   100   001    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   001    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   001    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   001    Old_age   Always       -       0
202 Perc_Rated_Life_Used    0x0018   098   098   001    Old_age   Offline      -       2
206 Write_Error_Rate        0x000e   100   100   001    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 0
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 0 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 08 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 03 08 c0 f6 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 10 00 e0 f6 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  34d+08:28:50.816  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  34d+08:28:50.816  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  34d+08:28:50.816  IDENTIFY DEVICE

Error -1 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 00 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 03 00 e0 f5 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 10 00 e0 f4 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f3 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f2 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f1 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED

Error -2 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 08 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 03 08 c0 f6 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 10 00 e0 f6 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  34d+08:28:50.816  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  34d+08:28:50.816  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  34d+08:28:50.816  IDENTIFY DEVICE

Error -3 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 00 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 03 00 e0 f5 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 10 00 e0 f4 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f3 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f2 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED
  60 00 00 e0 f1 d3 40 00  34d+08:28:50.816  READ FPDMA QUEUED

Error -4 occurred at disk power-on lifetime: 5596 hours (233 days + 4 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 50 08 c0 f6 d3 40   at LBA = 0x00d3f6c0 = 13891264

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 d0 08 c0 f6 d3 40 00  34d+08:18:50.816  READ FPDMA QUEUED
  60 d8 00 e0 f6 d3 40 00  34d+08:18:50.816  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  34d+08:18:50.816  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  34d+08:18:50.816  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  34d+08:18:50.816  IDENTIFY DEVICE

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      5608         -
# 2  Extended offline    Completed: read failure       70%      5598         64222912
# 3  Vendor (0xff)       Completed without error       00%      5597         -
# 4  Extended offline    Completed: read failure       70%      5595         64222912
# 5  Extended offline    Completed: read failure       70%      5585         64222912
# 6  Extended offline    Completed: read failure       70%      5584         64222912
4 of 4 failed self-tests are outdated by newer successful extended offline self-test # 1

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Was sagt ihr?
Jetzt besteht sie den Selftest without error, oder?

SSD clonen mit Clonezilla fehlgeschlagen: bad sectors

Lt. Junior Grade

Banned

Lt. Junior Grade

Rumo

Gast

Lt. Junior Grade

Banned

Rumo

Gast

Lt. Junior Grade

Rumo

Gast

Lt. Junior Grade

Rumo

Gast

Lt. Junior Grade

Anhänge

Rumo

Gast

Lt. Junior Grade

Banned

Lt. Junior Grade

Rumo

Gast

Lt. Junior Grade

Banned

Lt. Junior Grade

Ähnliche Themen

Passend zum Thema