paunaro schrieb:
Linux selber ist nicht das Prob!
http://blog.fefe.de/?ts=ab522174
Steht da war über mdraid? Der Fehler tritt bei mdraid im Zusammenhang mit TRIM auf! Ohne zu wissen ob die betroffenen SSDs im RAID laufen, sind also die ganze Informationen in den Linux Mailing Lists über Probleme nichts wert, gar nichts! Über Queued TRIM steht doch schon schon von im ersten Update im Blog:
Den letzlich Schuldigen hatte sie auch schon auf der Liste der Verdächten:
Piktogramm schrieb:
Da Holt hier mitlesen wird: Maeh, du hattest recht.
Alles klar, gut das zu hören. Fehler und Fehleinschätzungen passieren und man muss die auch zugeben können, dann lernt man auch daraus.
blackiwid schrieb:
Selbst wenn der Bug im Linuxkernel drin waere, er ist opensource und der Treiber darin sollte zumindest von Samsung kommen, wenn nicht, dann sind sie daran auch schuld.
Wieso sollte der Treiber für eine SATA SSD von Samsung kommen? SATA SSDs brauchen und haben keine Treiber, die haben nur die SATA Host Controller und da gibt es bei Windows einmal den Microsoft, also den PCIIDE für den IDE Modus und dann den MSAHCI und seid Win 8 STORAHCI und alternativ die von den Herstellern der SATA Host Controller, die können auch in den Chipsätzen stecken, also von AMD, ASMedia, Intel, Marvell, NVidia etc.
Es gibt für SATA SSDs definitiv keine Treiber von den Herstellern der SSDs, oder kennt Du einen Treiber von z.B. Crucial, Kingston, OCZ, Plextor, Samsung, Toshiba oder Transcend für ihre SATA SSDs? Da gibt es wenn, dann diese meist unsinigen SSD Toolboxen und wenn es SSD Treiber gibt, dann nur für Modelle mit PCIe SSDs mit RAID Controllern drauf.
blackiwid schrieb:
Egal wie mans dreht und wendet Samsung ist schuld.
NEIN, egal wie man es dreht und wendet, Samsung ist da komplett unschuld, wegen erwiesener Unschuld freigesprochen, das Basher wie Dich aber nicht abhalten wird sie dafür trotzdem weiter zu bashen, auch weil sie eben keine Ahnung von dem ganzen Thema haben, dafür aber umso mehr Meinung kundtun. Du weißt ja nicht einmal, dass SATA SSD keine Treiber haben und brauchen.
blackiwid schrieb:
dann ploetzlich sei der Kernel schuld, wer auch immer dieser Herr Kernel ist.
Und Du weißt offenbar auch nicht einmal was ein Kernel ist, noch trauriger.
abulafia schrieb:
Ein Fehler, der nicht unbedeutende Schäden verursacht hat. Sowohl bei Algolia als auch bei Samsung.
Welchen Schaden hat denn Algolia genommen? Die sind doch dadurch erst viele Leute bekannt geworden, so wie Backblaze über seinen Blog und die Veröffentlich der Ausfallraten ihrer HDDs wohl mehr Leuten als durch ihre Werbung bekannt geworden ist.
abulafia schrieb:
Bleibt am Ende die Frage der Schuld also offen?
Nein, Schuld ist ein Bug im Linux Kernel, wer den zu verantworten hat, müsste man in den ganze Chancelogs nachsehen, aber da gilt am Ende dann vermutlich nur: "Shit happens"
VollgasPilot schrieb:
Einfach nur peinlich, was samsung immer für einen unfertigen Mist auf den Markt wirft.
Nein peinlich ist nur VollgasPilot der unfertigen Mist ins Forum wirft. Samsung hat keinen Fehler gemacht, die haben einen bei Linux aufgedeckt der letztlich dazu geführt hätte, dass alle SSDs die dem System ähnliche Fähigkeiten melden auf der Blacklist gelandet werden. Da Samsung rund 50% Marktanteil bei SSDs hat, war die Wahrscheinlich früh betroffen zu sein eben auch besonders hoch.
Wolfsrabe schrieb:
Wenn der Fehler weder in der Algolia-Software noch an der Samsung-SSD sondern im Linuxkernel zu finden war, sollten doch SSDs anderer Hersteller in derselben Konstellation ebenso betroffen sein. Warum ist das nicht der Fall?
Einfach weil die SSDs andere Identify Device Data haben und die Betriebssystem diese entsprechend den Angaben oder auch anders ansprechen. Da steht extrem viel darüber drin, was eine Platte unterstützt, z.B. welche Version des SATA Sandards, welche Feature, wie viele Befehle gleichzeitig ausstehen dürfen (die QueueDepth), über wie viele LBAs ein Zugriffe maximal gehen darf und eben auch wie viele "512-byte blocks of LBA Range Entries per DATA SET MANAGEMENT command" erlaubt sind, bei den Intel nur 4, bei Micron und Samsung 8. Entsprechend größer muss der Puffer im Kernel sein wo diese zu Daten zusammengestellt werden und wenn der Bug nun den hinteren Bereich überschreibt in diesem Buffer überschreibt, also da wo bei 4 Blocks keine Daten mehr stehen, dann ist Intel nicht beroffen aber alle anderen wären es. Man müsste das mal ausprobieren indem man den Wert entsprechend reduziert und schauen ob der Fehler nocht auftritt. Damit kann eben auch ein FW Update, welches dann statt 4 nun 8 erlaubt zum Auslöser werden und plötzlich ist die SSD betroffen und alle schwören es gäbe einen Bug in der neuen FW.
Wolfsrabe schrieb:
EDIT: Das Mißverständnis liegt ja im Treiber... gibt es verschiedene Treiber für verschiedene SSDs?
Nein, es gibt keine Samsung Treiber für die Samsung SATA SSDs, das ist Müll und egal ob die Systeme mit Intel oder Samsung betrieben wurden, der Treiber waren bei gleicher Linuxversion und -konfiguration auch die Gleichen. Keine Ahnung wer sich jetzt den Mist mit den Treiber ausdenkt, dass ist aber totaler Schwachsinn.
Jesterfox schrieb:
Das Problem der 840 EVO mit queued TRIM existiert zwar (übrigens gabs das Problem auch bei Crucial und ist bei der M500 nicht gefixt worden), aber der Patch stammt schon vom Mai und hat nichts mit dem Problem von Algolia zu tun.
Sicher? Wie gesagt sind alle Angaben zu Problemen nur dann zu gebrauchen, wenn die SSDs nicht im RAID liefen und alle wo man das nicht weiß, sollte einfach vergessen. Vermutlich kann da einiges aus der Blcklist und bei anderen wäre ich auch vorsichtig, ob der Bug wirklich in der FW liegt. Man auch mal dir Werte von Word 105 und 222 der Identify Device Data eine MX100/m550 mit MU01 und mit MU02 FW vergleichen, wenn sich da was geändert hat, war es kein Bugfix in der FW der SSDs, sondern nur um einen Bug bei Linux nicht zu triggern.
Jesterfox schrieb:
Aber es ist durchaus möglich das ein Fehler nur mit bestimmter Hardware auftritt und diese Hardware trotzdem nicht Schuld ist weil ihr Verhalten zwar anders aber trotzdem innerhalb der Spezifikationen liegt.
Wohl eher weil die Angaben zu den Fähigkeiten bei dem OS zu unterschiedlichen Arbeitsweisen und z.B. Puffergrößen führt. Wenn eine SSD angibt etwas nicht zu könne, dann wird das OS auch die entsprechenden Funktionen für diese SSDs nicht anwenden und es werden dann u.U. eben anderen Routinen durchlaufen in denen es einen bestimmten Bug vielleicht nicht gibt. Die sind ja nicht alle gleich und werden auch nicht alle gleich behandelt.
G2xPQRmHnT schrieb:
Soweit ich es in der Mailinglist gelesen habe, lag es sehr wohl an Samsung. Da diese sich nicht an die Spezifikationen gehalten haben!
Wo hast Du was gelesen? Die Mailinglist schreiben nur, was passiert und nicht wieso, genau wie der Blog von Algolia auch nur geschrieben hat was passiert ist, die Ursache war aber eben nicht die, die man vermutet hat, auch wenn es manche nicht einsehen oder verstehen können bzw. wollen.
G2xPQRmHnT schrieb:
Es liegt wohl daran, dass die SSDs die TRIM + NCQ nicht richtig verarbeiten bzw. sich an die Vorgaben halten.
Gibt es wirklich einen Bug in der FW der (Samsung) SSD mit Queued TRIM oder gibt es da bei Queued TRIM auch einen Bug im Linux Kernel? Oder waren die betroffenen SSDs Teil eines md-raid und der nun gefundenen Bug hatte dort zugeschlagen? Der hat aber wohl mit Queued TRIM aber nichts zu tun.
Seth666 schrieb:
Mir ist völlig egal wer Schuld war. Ich hab Seit 6 Jahren nur Crucial SSDs in Betrieb, musste noch nie irgend etwas patchen, alles läuft wie geschmiert unter Win sowie unter Linux. Samsung, die gefühlt in den letzten Jahren 78 Patches veröffentlicht haben für ihre Produkte
Bei den SSDs gab es bei Crucial aber mehr FW Updates als bei Samsung und einige sollte man nicht auslassen, sonst trifft einen noch der 5184 Stunden Bug der m4. Da Samsung natürlich ein sehr viel größeres Produktangebote als Crucial hat, gibt es im ganzen halt auch mehr patches, aber nur auf SSDs bezogen waren es eben weniger und nur der Vergleich macht Sinn, oder hast Du ein Crucial Smartphone und einen Crucial Fernseher?