pipip schrieb:
strex
BTW, das was ich hier jetzt schreibe ist nicht weniger Spekulation was du betreibst, also bitte weniger spekulieren Strex.
Viel spekulieren muss ich da nicht. Die Zahlen lieferst du ja selbst. 10% vom Code müssen erneut angefasst und angepasst werden. Bei jeder Konvertierung. Das bedeutet ich habe hohe extra Kosten im Gegensatz zu nvidia wo es gleich läuft. Das bedeutet dann auch, dass die Software mal 10% oder mehr kostet und das bei Änderungen wieder 10% dazu kommen. Wer mal Debugging betrieben hat, weiß dass da schnell mehr Zeit drauf geht als den kaputten Teil neu zu programmieren.
Für die 10% wovon wir sprechen kann ich zig Karten kaufen. Warum sollte ich das dann tun? Wirtschaftlich macht das keinen Sinn. Denn ich zahle 10% oder mehr für die Programmierung nur das es auf AMD läuft und das für jedes einzelne Programm das ich habe.
pipip schrieb:
K12 ist hier auch Offtopic. XGene ist kein Vergleich und ihr beide geht bei K12 von einem aktuellen A53 oder A72 Core aus.
Da K12 laut Gerüchten offensichtlich mindestens genauso breit, wenn nicht breiter als Cyclone wird und zusätzlich noch SMT hat, ist man was die IPC allein angeht, schon sehr nahe an der Core I Serie, denn der A-Prozessor von Apple ist nicht mehr weit weg.
Aber auch nur wenn man den Xeon oder Core I nicht mit AVX und co. füttert. Das haben wir aber oft im dem Umfeld und dann sieht der Apple A wieder sehr klein aus. Da zählen dann eben nicht Browserbenchmarks.
Schau dir einfach mal das Design des X-Gene 2 (
http://www.hotchips.org/wp-content/...30-X-Gene-Singh-AppMicro-HotChips-2014-v5.pdf) an und vergleichen es mit deinem Wunder K12. Oh, sehr ähnlich. Fast gleiches Konzept. Nur das X-Gene 2 noch in 28nm gefertigt wird. Von den Specs ala Memory, 10GE und co. ist der K12 ein Clone des X-Gene 2. So gar L1, L2 und L3 sind vom X-Gene 2 mit des K12 absolut identisch. Merkwürdig. Was für ein Wunder der X-Gene 2 bietet auch bis zu 8 A57 Kerne, genau so wie der K12.
Und der K12 verwendet A57 Kerne. Wo, steht genau hier. Das schreibt sogar AMD selbst:
http://www.golem.de/news/opteron-a1...ke-im-server-markt-ausnutzen-1504-113676.html
Der X-Gene 2 ist genau so ein Abklatsch des A57 mit eigenen Anpassungen/Verbesserungen. Genau das was der K12 auch macht. Von dem X-Gene 2 ist die Leistung bekannt. Ist selbst angegeben. Dann rechnen wir gut gläubig 1 GHz für den K12 drauf (also 3,8GHz) zwecks besser Fertigung und so, dann sieht immer noch Spec2006_rate/W nicht so gut aus. Da muss der X-Gene 2 die über 3 fache Effizienz (Performance/Watt) zu den Atoms aufholen zum X-Gene 1:
http://www.cnx-software.com/2015/04...720-vs-applied-micro-x-gene-1-vs-ibm-power-8/ Das gibt selbst apm nicht an (
http://www.hotchips.org/wp-content/...30-X-Gene-Singh-AppMicro-HotChips-2014-v5.pdf). Denn der X-Gene 2 ist nur 0,6 fach so Effizient wie der X-Gene 1. Das hole ich auch nicht mit einer besseren Fertigung auf, denn es fehlen noch fast die 2,4 fache Effizienz. Dann habe ich ja erst noch mit den Atoms (Avoton) aufgeschlossen die auch noch in 22nm sind. Vom Xeon-D jetzt nochmals ganz abgesehen der eh ein P/W König ist.
Wenn man sich beide Designs anschaut hat man eher die Vermutung das AMD den X-Gene 2 einfach nachgebaut hat. Features, Design, Memory, Schnittstellen alles gleich.
Nai schrieb:
Edit: Aah sie wollen gar CUDA nicht nach OpenCL umtransformieren. K.a. wo ich das die letzte Zeit aufgeschnappt habe.
Ja genau, die wollen die Cuda Syntax auf OpenCl konvertieren und dann kompilieren. So schreibt es jedenfalls anandtech hier und ist auch schön auf den Bildern zu sehen. Deshalb auch Cuda syntax-like:
http://www.anandtech.com/show/9792/...e-announced-c-and-cuda-compilers-for-amd-gpus
Wenn die Funktion X bei Cuda das aufruft, wird jetzt versucht zu schauen was die Funktion macht und wird dann nachgebaut. So da die Cuda Syntax dann später beim kompilieren statt der Cuda Funktion die nachgebaut für OpenCl verwendet. Ähnlich Google Dalvik Virtual Machine zu Java Virtual Machine, wo man die APIs nachgebaut hat. Das ist, wie auch anandtech wieder beschreibt, rechtlich nicht ganz sauber und nvidia könnte da AMD ordentlich in die Suppe spucken. Zudem muss beachtet werden, wenn nvidia neue Funktion einbaut oder Änderungen vornimmt muss AMD erst wieder die gesamten Tools für die Konvertierung anpassen.
Deshalb muss auch 10% vom Programmcode nach der Konvertierung (Angabe von AMD) händisch selbst angepasst werden, weil keine passende Umformung möglich ist.