News Prime95: Intel erkennt Stabilitätsproblem bei Skylake-CPUs an

So ärgerlich solche Fehler sind, ganz vermeiden lassen die sich wohl nicht. Was mich aber wirklich interessiert sind die Auswirkungen abseits eines wirklichkeitsfremden Benchmarks (ich zitiere mal aus den Artikel: Es könne aber dennoch über 12 Stunden dauern, bis sich der Fehler in Form „eines aussteigenden Werkers“ bemerkbar mache. „Mitunter muss man auch einige Male neustarten“, heißt es weiter.).
 
Der Fehler tritt typischerweise innerhalb von einer Stunde auf. Die 12 Stunden verweisen nur darauf, dass der Fehler im Einzelfall erst sehr spät auftritt.
 
Dann muss ich dass mal mit meinem bei genügend Zeit mal testen. Hab meinen i7 6700k noch gar nicht übertaktet.
 
Ok. Aber tritt der Fehler nur bei Prime auf oder auch bei alltäglichen Arbeiten mit den PC. Wenn nur bei Prime, dann ist der Fehler meiner Ansicht nach völlig irrelevant. Wer PC/CPUs übertakte arbeitet nicht ernsthaft damit.
 
amorosa schrieb:
Abwarten. Fehler können und WERDEN immer und überall vorkommen. Klar ist ein Bios-Update nicht die sicherste Methode, aber immerhin wurde es eingestanden und ein Fix kommt raus. Ist doch in Ordnung so ! Besser als das, was NVIDIA angestellt hatte :D

Ich sehe nicht ein, dass bei einem missglücktem Bios-Update ich auf den Kosten sitzen bleibe.
Oder wir nehmen es als "feature".

Amusens schrieb:
hmm wie lange gibt es schon die Skylake-CPU's?

Da ist ja schon besser wie bei der GTX970 3,5GB ^^ später erst kaufen?! Wenn so was ans Tageslicht kommt.

Daher warten und nicht immer alles neue gleich kaufen.
Aber die Leute...
 
Für Menschen, die nicht den ganzen Tag Prime zocken ist das vermutlich nicht relevant.
Also erstmal ruhig durchatmen!!
Durchatmen kann man hier ganz sicher nicht, solange man nicht genau weiß, unter welchen Bedingungen genau das Problem auftritt.

Irgendwo war die Rede von AVX-Code sowie aktivem Hyperthreading und sehr hoher Last. Sollte das tatsächlich Voraussetzung sein, um den Fehler zu triggern, könnte prinzipiell jedes selbst compilierte Linux-Programm betroffen sein, genau wie x264/x265, jedes Java-/C#-Programm - nur würde die Wahrscheinlichkeit, den Fehler zu triggern, dort deutlich geringer sein als bei Prime. Dass der Fehler auch da teilweise erst nach mehreren Stunden und damit nach vielen Billionen abgearbeiteten Befehlen auftritt, zeigt ja, dass es nur sehr selten passiert - aber es könnte quasi zu jedem beliebigen Zeitpunkt passieren.
 
jodd schrieb:
Aber tritt der Fehler nur bei Prime auf oder auch bei alltäglichen Arbeiten mit den PC.
Hm, da solche Faltungsberechnungen (FFTs) auch nichts weiter als Mathematik sind, könnte man beinahe davon ausgehen, dass der Fehler auch im Alltag auftritt. Unter Prime-Stress werden vielleicht seltene Register o.ä. verwendet - jedoch tut Intel auf jeden Fall richtig daran, das grundlegend zu investigieren.
 
jodd schrieb:
Ok. Aber tritt der Fehler nur bei Prime auf oder auch bei alltäglichen Arbeiten mit den PC.

aurum hat's pefekt zusammengefasst:

aurum schrieb:
Ist bisher unklar.

Die Infos, die Intel im Forum dazu gibt, sind eben sehr dürftig. Andererseits hätte das Problem schon weitaus höhere Wellen geschlagen, wenn es häufig auftreten würde.
 
Da sollte sich der eine oder andere mal die Spec Updates (etwa http://www.intel.com/content/dam/ww...s/desktop-6th-gen-core-family-spec-update.pdf) von Intel oder AMD anschauen. Dann weiß man auch warum zig Updates im Bios stecken und es meist mehr heiße Luft ist.


VikingGe schrieb:
Durchatmen kann man hier ganz sicher nicht, solange man nicht genau weiß, unter welchen Bedingungen genau das Problem auftritt.

Stell das jetzt nicht schlimmer hin als es ist. Du tust ja schon so als das jede Kiste mit Skylake nach 10 Minuten immer abschmiert. Schau lieber einmal in die Spec Updates da gibt es noch einige andere schwere Bugs.
 
Zuletzt bearbeitet:
Natürlich tritt der Fehler auch in anderen Programmen auf, wenn dort die entsprechenden Bedienungen erfüllt werden. Um das exakt beantworten zu können, müsste man aber die Analyse von Intel kennen. Veröffentlichen die ihre Prozessor-Bugs nicht irgendwo?
 
strex schrieb:
Du tust ja schon so als das jede Kiste mit Skylake nach 10 Minuten immer abschmiert.
Äh, ja, sicher:
VikingGe schrieb:
Dass der Fehler auch da teilweise erst nach mehreren Stunden und damit nach vielen Billionen abgearbeiteten Befehlen auftritt, zeigt ja, dass es nur sehr selten passiert

Nein, was ich sage, ist, dass ein (undokumentierter) Fehler mit unbekannter Ursache nunmal ein großes Problem ist. Den 08/15-Desktop-User mag es nicht stören, wenn die Kiste 1x im Jahr wegen sowas abstürzt, in anderen Bereichen würde man sich aber gerne darauf verlassen können, dass der Code, den man hat, auch stabil ausgeführt wird.

Veröffentlichen die ihre Prozessor-Bugs nicht irgendwo?
Hat strex gerade gepostet.
 
Zuletzt bearbeitet:
Ich verstehe die Aufregung nicht. Solang im Alltag alles in Ordnung ist, muss ich doch nicht versuchen mit irgendeiner Software Fehler "herbeizuführen" ??? :confused_alt:

P.S: Ich habe jetzt schon genug Skylake-CPUs verbaut und ich, bzw. der Kunde hat bisher nie einen Fehler gehabt?!
 
VikingGe schrieb:
Nein, was ich sage, ist, dass ein (undokumentierter) Fehler mit unbekannter Ursache nunmal ein großes Problem ist. Den 08/15-Desktop-User mag es nicht stören, wenn die Kiste 1x im Jahr wegen sowas abstürzt, in anderen Bereichen würde man sich aber gerne darauf verlassen können, dass der Code, den man hat, auch stabil ausgeführt wird.

Die meisten Fehler sind vorher unentdeckt und werden somit erst bei Spec Update aufgelistet. Da gibt es doch einige die erst später von Entwicklern gefunden worden, etwa beim BMI mit cpuid bei Skylake (https://software.intel.com/de-de/forums/intel-isa-extensions/topic/584240). Dieser Fehler konnte ebenfalls zu einem Crash führen. Wurde entdeckt, geprüft und behoben. Das wird auch der Fall sein.

Ein Code der ausgeführt wird, ist nie zu 100% stabil. Da muss man erstens unterscheiden, was wichtig ist: Code läuft immer oder produziert immer richtige Ergebnisse. Beides lässt sich nicht garantieren. Denn eine CPU oder der Compiler der den Maschinencode erzeugt kann immer unbekannte Fehler besitzen. Wenn man das möchte, braucht man mehrere unabhängige Systeme mit mehreren Durchläufen. Die Ergebnisse kann man dann später vergleichen. Das garantiert aber immer noch nicht ein 100% Ergebnis oder dass das Programm immer läuft. Ob der Code dann auch immer zu 100% läuft, ist auch nicht garantiert. Die Zustände im Memory oder den Registern sind immer unterschiedlich, wer garantiert einem in jeder Permutation das der Code korrekt ausgeführt wird. Keiner, denn das kann nicht gefordert werden, da technisch unmöglich.

Viel schlimmer finde ich unentdeckte Bugs in VMX oder der IOMMU die einen Ausbruch ermöglichen könnten und so eine Sicherheitslücke darstellen kann die ziemlich gravierend sein kann.
 
Zuletzt bearbeitet:
Ist doch ein Fortschritt, frühere Generationen haben schon den Geist aufgegeben wenn man den Rechner in eine volle Badewanne gestellt hat.
OK bei Prime tritt der Fehler auf aber wo den noch und wie äußert er sich dann... Das ist doch ein theoretischer nonsens.

Bei den 486ern gab es auch mal einen Bug. der verursachte tatsächlich bei Excel Rechenfehler. Ab der xxxxxxten Nachkommatelle.
Unter bestimmten Bedingungen. Der Wind musste von süden wehen z. Bspl... Ein Hype, auch damals aber für 99,99usw. % der User total unerheblich...

Wer experimentiert denn bitte mit xstelligen Zahlen rum, wartet dann 12Std.+ bis der Rechner eventuell aussteigt?
Um dann die nächste x-stellige Zahl zu probieren.
Mich würde interessieren wann der Gute seine erste Skylake CPU bekommen 1995?

Sorry für mich Bullshit!
 
Den 08/15-Desktop-User mag es nicht stören, wenn die Kiste 1x im Jahr wegen sowas abstürzt, in anderen Bereichen würde man sich aber gerne darauf verlassen können, dass der Code, den man hat, auch stabil ausgeführt wird.
Und dort verwendet man dann auch keine olle Desktop-CPU, sondern Xeon, Opteron, Itanium (wenn nicht bereits ausgestorben) & Co.

Aber wie sieht es mit den Xeons aus?
 
Und auch ein noch so toller Xeon im teuersten Server kann mal abschmieren... Wobei es meist nicht an der Hardware liegt ;)
 
Zurück
Oben