Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsIntel Knights Landing mit 7,2 Mrd. Transistoren in 14 nm
Er hat sich halt noch nie die Performance von Phi gegenüber GPU mit großen und unterschiedlichen Matrixgrößen angeschaut, obwohl das jeder in der c't nachlesen kann. Aber er beschränkt uns sicher wieder mit seinen super fundierten Fakten mit Belege.
Man muss unterscheiden zwischen theoretischer Rechenleistung und der Rechenleistung in tatsächlichen Anwendungen. GPUs haben häufig sehr hohe theoretische Leistung, können diese aber häufig bei Computing-Anwendungen nicht vollständig umsetzen.
Man wird nicht die Packungsdichte von Broadwell (15,85 Mio. Transistoren pro mm² -> 455mm² für 7,2Mrd. Transistoren) erreichen, aber soviel schlechter?
Naaah hätte gerade im Moment am liebsten einen GPU-Cluster aus n paar Titans, Geforce 980ern oder so
Nö, einfach Nö
Normalerweise schreibst du doch wesentlich fundierter
"Die Rechenleistung" als solches gibt es ja nicht. Sondern immer nur für spezielle Anwendungsfälle und je nach Anwendungsfall erreichen die verschiedenen Konzepte doch sehr unterschiedliche Ergebnisse.
Ein Gutes Beispiel ist m.E. eine Partikelsimulation. Man hat viele Partikel und die Partikel üben auf sich gegenseitig Kräfte aus, welche eine kurze Reichweite besitzen. Siehe zum Beispiel: http://www.youtube.com/watch?v=RqduA7myZok. Die Kräfte sind allerdings wegen des dritten newtonschen Gesetzes (Aktio = Reaktio) symmetrisch. Auf der CPU kann man diese Symmetrie ausnutzen um sich die Hälfte der Berechnungen einzusparen, indem man die Kraft zwischen zwei Partikeln nur einmalig berechnet, und dann die Kraft zu den Kraftsummen der beiden Partikel hinzuaddiert. Dadurch wird die Simulation im Endeffekt in etwa um 50 % schneller wird. Auf der GPU ist dieses Einsparen wegen ihrer höheren Parallelität nicht möglich. Dadurch berechnet die GPU im Endeffekt alles doppelt, wodurch man auch 50 Prozent der Rechenleistung der GPU verschwendet.