Bericht Bericht: Nvidia GF100: Technische Details

stoneeh · 19. Januar 2010

diese 200-800% schneller als gtx285 in manchen szenarien werden schon stimmen. wies mit der real life performance in dx9/dx10 spielen aussieht hat man beim far cry 2 benchmark der die letzten tage aufgetaucht ist ja gesehen. ist nicht viel um zur hd5870. naja, die performance einschätzung in meiner sig beruht auf den ersten daten die man von der karte zu lesen bekam und ist schon ne weile alt aber ich ändere sie nicht, ich glaube im mittel wird sie 25-45% schneller als eine hd5870

Schinzie · 19. Januar 2010

stand bei dir net mal 100% in der signatur?^^

gruß

danko71 · 19. Januar 2010

Da auch immer wieder Spekulationen über die Marktstellung der beiden Kontrahenden ATI und Nvidia angestellt werden möchte ich nur mal so am Rande auf den Umstand hinweisen das diese nicht durch die High End Karten definiert wird. Es ist zwar nett und vielleicht auch werbewirksam die Perfomancekrone inne zu haben aber das Geld wird nicht in diesem Marktsegment verdient sondern bei den Karten um und unter 100 EURO. Da kann der GF100 noch so toll werden wen Nvidia in diesem Segment nicht auch was konkurrenzfähiges auf den Markt wirft sieht es um die Marktanteile eher düster aus.
Was meint ihr warum ATI/AMD sonst ihre durch TSMC zur Verfügung stehenden Produktionskapazitäten eher für RV840 Chips nutzen als für RV870.

Complication · 19. Januar 2010

AwesomeSauce schrieb:
Noch @Complication
Der Tesselator in der PolyMorph Engine Einheit ist dediziert, denn er tut nix anderes... Nvidia hat sich vom zentralen Tesselator-Design abgewendet, da sie glaubten, hier auf einen Flaschenhals zu stossen - Die werden schon ihre Gründe haben, dass sie das Design parallelisiert haben...[/URL]

Das mit dem Unterschied zentral/parallelisiert ist ja richtig. Auch dass es 16 Tessellatoren sind die jeder für sich eine eigene Einheit sind. Das ist es aber nicht worum es geht in der Diskussion ob dediziert oder nicht.

Hier wirds nämlich nun Haarspalteier und nur noch sematische Unterscheidung.
Dediziert soll in diesem Fall heissen, dass Tessellatoren zu jederzeit bereit stehen und eingesetzt werden können. Dies mag in sofern bei Nvidia stimmen, als das der Tessellator selber dediziert ist und eine eigenständige Einheit ist. Diese ist jedoch in der Polymorphen Einheit untergebracht.
Die Polymorphe Einheit selber ist allerdings nicht dediziert und muss auch andere Aufgaben wahrnehmen - somit: kann eine Aufgabe für den Tessellator nicht durchgeführt werden wenn gerade andere Sachen anliegen? Das gilt es zu beantworten.

Es ist zudem gar nicht gesagt, dass die physiklaische Unterteilung tatsächlich so ist wie das in den Diagrammen dargestellt wird und tatsächlich jede der 5 Komponenten in der Polymorphen Einheit eigene Baugruppen verwendet. Oder ob sie alle die selben nutzen wenn sie am arbeiten sind - also intern immer nur einer der 5 aktiv sein kann zur selben Zeit.
Das würde dann bedeuten, dass die Tessellatoren nur auf dem Papier dediziert dargestellt werden, aber in Wirklichkeit lediglich shared Cores nutzen. Hier müssen wir auf mehr Infos warten.

JokerGermany · 19. Januar 2010

@JimPanse1984

Ich gehe an die HD6XXX Serie genauso skeptisch ran wie an die GF100.
Denn es ist ne komplette Neuentwicklung und könnte ein Reinfall werden.
Die "Gefahr" der HD6XXX seher ich auch für Nvidia, ob es aber eine wirkliche Gefahr wird, muss sich erst herausstellen.

Lübke · 19. Januar 2010

nur mal so am rande, warum nvidia imho so viele tesselationseinheiten im fermi hat:
der chip besteht aus 16 x dem kleinsten gf1xx chip. fast alle ausführungseinheiten sind rendundant. so kann nvidia ganz einfach die produktion auf alle varianten des fermi umstellen. zwar sind die kosten hierdurch beim "vollfermi" höher, aber insgesamt dürfte diese flexibilität durch die modulare bauweise kosten einsparen.

quaiky · 19. Januar 2010

ich will nicht sagen dass charlie recht hat aber ich sehe in den angaben von nvidia nichts was diese aussagen wirklich entkräftet, es gibt dort jeweils noch genug spielraum dass charlies aussagen auch stimmen könnten.
dass yields mit 448 cores doppelt so gut sind wie mit 512 cores für die die yields noch sehr neidrig sind ist sehr realistisch (ist ja etwa das gleiche wie bei amd multicore prozessoren bei denen teil defekte modelle als kleinere modelle verkauft werden können).
Diese aussage lässt sich erst beim launch beweisen/wiederlegen. Wenn diese aussage stimmt und die leistung passt, dann würde ich damit rechnen das nvidia 2 modelle vorstellt das teure top end modell mit 512 cores als stärkste single core grafikkarte mit sehr schlechter lieferbarkeit und die 448 (oder noch weniger um noch mehr verschnitt nützen zu können) cores variante die hoffentlich noch eine vergleichbare performance wie die radeon 5870 liefert als gegenstück zu diser mit einiges besserer leiferbarkeit. wenn nvidia aber zb 2 modelle mit 512 cores rausbringt die sich nur in taktfrequenz und anderen details unterscheiden dann wäre das eher ein beweis dafür dass charlie nicht recht hatte.

Ausserdem kann auch die aussage dass es keine rein dedizierte tesselator hardware gibt weiterhin stimmen wie complication angedeutet hat.
nvidia hat nur angegeben dass jeder chip eine polymorph engine hat welche sich um den gesamten geometrie bereich kümmert, wie die genau ausgeführt ist ist komplett unklar, im prinzip könnte l nach den infos die wir von nvidia haben als extremes beispie auch nur ein allround prozessor drinstechken der programme für 5 einzelnen aufgaben einzelnen aufgaben hat. für die vermutung dass diese polymorph engine einen oder mehrere rechencores hat auf denen jeweils die einzelnen aufgaben ausgeführt werden können spricht auch die möglichkeit dass solche cores dann auch in der GPGU version gewisse aufgaben übernehmen könnten und nicht brach liegendes silizium wären. wäre also keine so schlechte design idee wenn mann von anfang an den chip in beide richtungen (sowohl grafik als auch gpgu) auslegt.

sogar die aussage dass die polymorph engines die schritte paralell abbarbeiten könnte sich auch nur darauf beziehen dass es 16 von diesen units gibt und muss nicht bedeuten dass innerhalb der unit paralellisierung möglich ist. (im artikel auf heise klingt das ganze eher nach dieser variante dass die paralellisierung nur durch das vorhandensein der 16 units zustande kommt und nicht innerhalb einer unit).
Dazu sollten spätestens zum launch noch mehr details ans licht kommen die da genauer darüber auskunft geben können.

zu den taktraten hat nvidia ja bis jetzt nichts bekanntgegeben, wird noch interressant was die takte beim launch sein werden.

Meriana · 19. Januar 2010

auch am Rande, weil interessant wegen der Konkurenz Situation:

müsste bei GF nicht der 32nm bulk prozess nun angelaufen sein? Das letzte von dem ich weiss ist, dass der SOI Prozess verzögert wurde und dass der Bulk prozess ende letzten Jahres anlaufen sollte....

JokerGermany · 19. Januar 2010

@Meriana:
Wollten die nicht gleich zu 28nm übergehen? (Warum auch immer...)

stoneeh · 19. Januar 2010

Schinzie schrieb:
stand bei dir net mal 100% in der signatur?^^

gruß

ich hatte jetzt etliche wochen in der signatur stehen "25-45% (von 50-100% runterkorrigiert nachdem textureinheiten/ROPs bekannt wurden)". hast halt nicht gesehen. seitdem hab ich nix geändert und werd ich auch nicht mehr, alle details sind bekannt, mehr brauchts nicht um die performance abzuschätzen (obwohl das absolut nicht leicht ist bei einem so radikal neuen design)

50-100% hatte ich nach dem ersten gerüchten geschätzt, denn damals war nur bekannt dass 1. es eine komplett neue architektur ist 2. 512 shader 3. damals war noch von 512bit speicherinterface mit ddr5 die rede 4. war damals nicht bekannt dass das hauptaugenmerk des chips auf GPU-computing liegen würde. anhand dieser daten war es nicht so abwegig dass der chip 2-3mal so schnell wie eine gtx2xx werden würde und somit ca 50-100% schneller als eine hd5870

grüsse
stoneeh

Meriana · 19. Januar 2010

TSMC hat 32nm gechancelt, die Frage ist aber, wie es bei GF aussieht. Ev. hat AMD ja beschlossen seine 32nm Pläne für GPU's mit GF fortzuführen.

Whoozy · 19. Januar 2010

stoneeh schrieb:
50-100% hatte ich nach dem ersten gerüchten geschätzt,

Sonst noch Träume gehabt in dieser Zeit ?

göschle · 19. Januar 2010

Die neuen Fermi Karten sollten dann eigentlich im kommenden Forceware gelistet sein.

quaiky · 19. Januar 2010

Meriana schrieb:
TSMC hat 32nm gechancelt, die Frage ist aber, wie es bei GF aussieht. Ev. hat AMD ja beschlossen seine 32nm Pläne für GPU's mit GF fortzuführen.

amd plant ja die fusion cpu/gpu combi in 32nm für 2011 (denke die wird bei gf produzeiert), könnte also sein dass sie davor einen gpu refresh in 32nm bei gloablfoundries probieren.

Lübke · 19. Januar 2010

denke eher, dass sie mit der cpu/gpu-kombi den anfang machen, weil a) cpu shrink vorrang hat aufgrund des zeitlichen vorsprungs von intel und b) weniger transistoren als eine highend gpu, daher leichter umzusetzen und billiger um den prozess ausreifen zu lassen.

Neo_Xsendra · 19. Januar 2010

@quaiky

kann nicht sein gf steigt sofort mit 28nm ein

EDIT: Sorry für die ungenauigkeit ... bezieht sich natürlich rein auf den für die grafikkarten (bulk heisst der glaub ich)

@allgemeinheit

wenn der chip wirklich nach diesem "verschnitt prinzip" verkauft werden kann, könnte NV tatsächlich:
1. einen launch über die komplette palette auf einmal durchziehen
und
2. die karten dank einem 90-100% yield doch sehr günstig werden

EDIT 2: stimmt denkfehler ... aber trotzdem würde ich dann noch auf 85-95% tippen

oder seh ich das falsch? -.^

Lübke · 19. Januar 2010

die karten dank einem 90-100% yield doch sehr günstig werden

nicht alle teile sind rendundant. von daher wird der yield deutlich geringer sein. allerdings kann man ein gros der teildefekten chips, bei denen eben nur die rendundanten komponenten beschädigt sind, einer "resteverwertung" in form von karten wie seinerzeit die 8800gs/9600gso g92 zuführen. das dürfte den ausschuss spürbar reduzieren, was beim schlecht funktionierenden 40nm-prozess sicher ein ordentlicher wirtschaftlicher vorteil sein dürfte.

quaiky · 19. Januar 2010

Neo_Xsendra schrieb:
@quaiky

kann nicht sein gf steigt sofort mit 28nm ein

weiss nur dass amd auf 32nm umsteigt mit prozessoren, und dabei auch der llano mit integrierter grafik für 2011 angekündigt ist.

https://www.computerbase.de/news/prozessoren/offizielle-desktop-plattform-roadmap-von-amd.26239/

nachdem amd ja angekündigkt hat cpus weiterhin hauptsächlich bei gf fertigen zu lassen wäre es seltsam aber nicht unmöglich dass sie diese woanders fertigen. aber offizielles bezüglich produktionspartner dafür hab ich noch nirgends gefunden.

Neo_Xsendra schrieb:
1. einen launch über die komplette palette auf einmal durchziehen

für high end und performance wäre es möglich, aber für midrange und darunter würde warscheinlich der leistungsbedarf der grossen chips ein killer sein.
vorstellung aller möglichen varianten am selben tag ist unwarscheinlich da die bardpartner auch zeit brauchen um die verschiedenen modelle produktionsfertig zu bekommen. aber in etwa die geschwindigkeit der launches von amd bei der 5000er serie wäre möglich denke ich.

Lübke · 19. Januar 2010

für high end und performance wäre es möglich, aber für midrange und darunter würde warscheinlich der leistungsbedarf der grossen chips ein killer sein.

es geht darum, dass die produktion ganz einfach umgestellt werden kann und im falle der untersten fermi-lösung einfach ein sechzentel-chip (kleinste rendundante einheit des fermi) + nichtrendundanten teil produziert werden kann.

Meriana · 19. Januar 2010

also 32nm bulk war von GF zumindest mal angekündigt.

Der SOI 32nm Prozess wurde auf Q3 2010 verschoben.
Vom Bulk 32nm Prozess war aber da nie die Rede in dem Zusammenhang.
Der Bulk 32nm von TSMC wurde ja bekanntlich gechanncelt.

Interessant ist vorallem die Frage: 32nm RV870 Variante ja /nein und wenn ja ab wann. Und natürlich wie viel diese dann Leisten mag im Vergleich zum GF100.

Bericht Bericht: Nvidia GF100: Technische Details

Banned

Rear Admiral

Ensign

Banned

Banned

Fleet Admiral

Lt. Junior Grade

Lt. Commander

Banned

Banned

Lt. Commander

Banned

Captain

Lt. Junior Grade

Fleet Admiral

Lieutenant

Fleet Admiral

Lt. Junior Grade

Fleet Admiral

Lt. Commander