Algolia vs. Samsung: Linux-Patch gegen TRIM-Bug mit Samsung-SSDs
Die Ursache für die Ausfälle von Servern der Firma Algolia ist gefunden. Samsungs Untersuchungen ergaben, dass ein „Missverständnis zwischen dem RAID-Treiber und dem SCSI/ATA-Treiber“ in Verbindung mit dem TRIM-Befehl zu Datenverlust auf den SSDs führte. Ein Patch für den Linux-Kernel soll das Problem beheben.
Vor rund einem Monat hatte ein Algolia-Mitarbeiter über die Server-Ausfälle durch Datenverlust berichtet und als Ursache eine fehlerhafte Ausführung des TRIM-Befehls genannt. Da nur Server mit Samsung-SSDs betroffen waren und Systeme mit Intel-SSDs verschont blieben, schlussfolgerte Algolia, dass das Problem bei den Solid State Drives von Samsung liegt. Bei den darauf folgenden Untersuchungen durch Samsung-Techniker konnte der Fehler zunächst nicht reproduziert werden.
Doch in der vergangenen Woche meldete sich Adam Surak im Algolia-Blog mit einem Update zurück. Samsung habe mit neuen Daten von Algolia den Fehler nachstellen können und auch die Ursache erkannt. Weder die Samsung-SSDs noch die Software von Algolia sei für den Fehler verantwortlich, sondern vielmehr der Linux-Kernel. Nach Angaben von Algolia hat Samsung zur Problemlösung einen Kernel-Patch entwickelt. Dieser war zunächst in den für Laien unergründlichen Tiefen der Linux-Community nicht auffindbar, wurde jetzt aber im Algolia-Blog verlinkt. Derweil hat sich der Linux-Entwickler Martin K. Petersen der Thematik angenommen und einen eigenen Vorschlag zur Anpassung des Kernel-Codes unterbreitet.