Intel Core 2 Extreme QX9650 im Test: Mit Penryn auf und davon
4/2745 nm Fertigung
Einmal mehr ist es die Fertigungstechnologie, die Intel einen gehörigen Vorteil verschafft. Nach dem Reinfall mit 90-nm-Strukturen – Stromverbrauch und Wärmeabgabe waren sehr problematisch – konnte der seit Ende 2005 eingesetzte P1264-Herstellungsprozess (65 nm) die Produktionskosten senken und wusste beim Stromverbrauch eine kontinuierliche Verbesserung einzuleiten. Selbst die als verschwenderisch bekannte Netburst-Architektur des Pentium 4 konnte mit dem in 65 nm gefertigten Presler (bzw. Cedar Mill als Single-Core-Vertreter) gezügelt werden. Mit P1266 – so die korrekte Bezeichnung für die 45-nm-Lithographie von Intel – soll der Zauber weiter gehen.
Prozessname | P856 | P858 | Px60 | P1262 | P1264 | P1266 | P1268* | P1270* | P1272* | |
---|---|---|---|---|---|---|---|---|---|---|
Produktionsstart | 1997 | 1999 | 2001 | 2003/4 | 2005 | 2007 | 2009 | 2011 | 2013 | |
Prozess (nm) | 250 | 180 | 130 | 90 | 65 | 45 | 32 | 22 | 16 | |
Lichtquelle (nm) | 248 | 248 | 248 | 193 | 193 | 193 | 193 | 13 | 13 | |
Wafergröße (mm) | 200 | 200 | 200/300 | 300 | 300 | 300 | 300 | 300 | ? | |
Interconnects | ||||||||||
Material | Al | Al | Cu | Cu | Cu | Cu | Cu | ? | ? | |
Lagen | 5 | 6 | 6 | 7 | 8 | 9 | ? | ? | ? | |
Kanalmaterial | Si | Si | Si | Strained Si |
Strained Si |
Strained Si |
Strained Si |
Strained Si |
? | |
Gate | ||||||||||
Kontaktmaterial | Poly-Si | Poly-Si | Poly-Si | Poly-Si | Poly-Si | Metall | Metall | Metall | ? | |
Dielektrikum | SiO2 | SiO2 | SiO2 | SiO2 | SiO2 | High-k | High-k | Higk-k | ? | |
Dielektrikumdicke (nm) | 4,08 | 2,0 | 1,5 | 1,2 | 1,2 | ? | ? | ? | ? | |
Länge ( nm) | 200 | 130 | 70 | 50 | 35 | 25 | 16? | ? | ? | |
SRAM-Größe (µm²) | 10,6 | 5,6 | 2,09 | 1,00 | 0,570 | 0,346 | 0,182 | ? | ? | |
* Angaben können sich Jederzeit ändern |
Die Tabelle zeigt einen Überblick über die bei Intel eingesetzten Prozesstechnologien der vergangenen zehn Jahre. Moores Law folge leistend, wurden die Grundbausteine eines jeden Prozessors, der (MOS-)Transistor, kontinuierlich verkleinert, um eine Verdopplung der Transistoranzahl alle zwei Jahre zu ermöglichen. Für einen kleineren Transistor müssen neben der Transistorfläche verschiedene andere Parameter angepasst werden. Bereits mit dem Anfang 2004 etwas verspätet eingeführten 90-nm-Herstellungsprozess wurde dabei die Dicke des Gate-Oxids, eine Isolatorschicht im Transistor, die das Gate elektrisch vom Kanal trennt, zu dünn, um seiner Aufgabe nachzukommen. Hohe Leckströme und damit ein hoher Stromverbrauch waren die Folge. Beim 65 nm wurde daher zum Leidtragen der Transistoreigenschaften auf eine weitere Reduzierung verzichtet. Unglücklicherweise war bei der nächst kleineren Technologiestufe ein solches Vorgehen nicht mehr möglich.
Das Problem: Seit den 1960ern hat sich die grundlegende Bauweise der Transistoren nicht geändert. Bei einem Wechsel zu 45-nm-Strukturen waren daher tief greifende Veränderungen erforderlich. Die Forschungsarbeiten in diesem Bereich haben bereits Mitte der 1990er Jahre begonnen. Des Problems Lösung: ein völlig neues High-k-Gate-Material und eine auf Metall basierte Gate-Elektrode. Zwei neue Materialien, die den kompletten Transistorherstellungsprozess auf den Kopf stellen sollten.
Die 45-nm-Technologie kommt erstmalig bei der Penryn-Mikroarchitektur zum Einsatz. Insgesamt hat Intel derzeit 15 Produkte auf Basis von 45 nm in der Entwicklung, die sich über die Produktbereiche Mobile, Desktop, Workstation und Enterprise (Server) erstrecken. Es folgt eine Vorstellung von P1266 im Detail.
Details
Mit P1266 kann Intel ohne kostspielige Neuausrüstung der Fabs, d. h. unter Einsatz bestehender Tools und der Benutzung von Lichtquellen mit 193-nm-Wellenlänge, die Transistordichte verdoppeln oder aber die Chipfläche der Prozessoren reduzieren und somit die Stückzahlen drastisch steigern. Die für einen Schaltvorgang benötigte Energie – bei CMOS als Schaltungstechnik fließt aufgrund der komplementär arbeitenden N- und P-Kanal-Transistoren ausschließlich beim Zustandswechsel (z. B. von 0 auf 1) ein Strom – konnte um 30 Prozent reduziert werden. Die Schaltgeschwindigkeit konnte um 20 Prozent gesteigert werden. Damit klettert auch die mögliche Taktfrequenz der Gesamtschaltung nach oben. Gleichfalls können mit dieser Verbesserung, ohne am Takt zu drehen, unerwünschte parasitäre Ströme von Source nach Drain (den beiden Anschlüssen des „Schalters“) um das fünffache abgesenkt werden. Das Leck unter dem Gate ist um eine Zehnerpotenz geschrumpft (im Rahmen von Forschungsveröffentlichungen mit größeren Strukturbreiten war noch von Faktor 100 die Rede).
Die 20 Prozent höhere Schaltgeschwindigkeit kann nicht nach Belieben gegen die um den Faktor 5 reduzierten Leckströme (Ioff) ausgetauscht werden. Vielmehr handelt es sich hierbei um einen Paramater (Threshold-Spannung) die bei der Prozessorproduktion festgelegt wird. Mit der Wahl dieser Spannung bewegt man sich auf einer Geraden die den Zusammenhang zwischen Transistorgeschwindigkeit und Leckströme aufzeigt (siehe Bild). Die 45-nm-Fertigung der Desktop-/Server-Prozessoren wurden auf Geschwindigkeit ausgelegt, die der Notebook-Prozessoren auf Stromsparen.
Die große Innovation und die Ursache für die geringeren Leckströme und höhere Performance von P1266 ist der Einsatz eines neuen Gate-Materials und eines neuen Gate-Isolators. Beim Gate-Oxid setzt Intel auf ein nicht näher bekanntes Material auf Hafnium-Basis das gegenüber dem zuletzt nur noch 1,2 nm dicken Siliziumoxid (5 Atomlagen), das Tunneln der Elektronen wesentlich effektiver behindert. In ersten Forschungspublikationen aus dem November 2003 wurde mit einer Dicke von 3,0 nm gearbeitet. Seitdem hat Intel keine neuen Angaben gemacht. Klar ist nur, dass es dicker als 1,2 nm ist und dadurch die Leckströme stark reduziert, ohne dabei die Transistorperformance zu beeinträchtigen.
Für die Geschwindigkeit eines Transistors ist die Oxidkapazität eine ausschlaggebende Größe. Sie gibt an, wie viele Ladungsträger bei einer am Gate anliegenden Spannung im Kanal für einen Stromtransport zur Verfügung stehen. Bei einer konstanten Dielektrizitätskonstante k (im deutschen eigentlich Epsilon) muss die Oxid-Dicke zu Gunsten schneller Transistoren jedoch kleiner werden. Denn je dünner, desto größer die Oxidkapazität und damit auch die gegenüberliegende Inversionskapazität im Kanal zwischen Source und Drain. Je größer diese Kapazität, desto größer ist der Strom, der durch den Transistor fließen kann und desto schneller kann er (an ihn angeschlossene Gates) schalten. Das bisher eingesetzte Siliziumdioxid hat eine Dielektrizitätskonstante von 3,9. Der Wert des neuen Materials ist nicht bekannt, allerdings hat Intel 2002 einige Messwerte für die Größe der Oxidkapazität bekannt gegeben.
Das nun auf Metall basierte Gate war im Zuge der Umstellung auf High-k nötig, da auf Hafniumverbindungen basierende Dielektrika und das bisher eingesetzte Polysilizium nicht miteinander harmonieren. Genauer gesagt hat der Transistor unter Verwendung von polykristallinem Silizium schlechtere Eigenschaften gezeigt als sein Vorgänger. Das Metal-Gate hat jedoch einen gravierenden Nachteil: es hält den Temperaturen bei den Dotierungsprozessen nicht stand. Damit kann das Gate nicht mehr als erste Struktur (Gate-First) erstellt werden. Die Self-Alignment-Eigenschaften für die Dotierung von Source und Drain gehen verloren und das Gate folgt nun im letzten Technologieschritt auf Siliziumebene (Gate-Last). Welche Materialien Intel genau einsetzt und wie der Gate-Last-Prozess funktioniert, ist noch geheim, da das Unternehmen hier einen besonderen Wettbewerbsvorteil vermutet. Es wird davon ausgegangen, dass AMD zwar bereits 2008 ebenfalls auf ein High-k-Gateoxid setzten wird, ein Metall-Gate allerdings erst wesentlich später Einzug halten wird.
Mit dem 45-nm-Prozess steht gleichermaßen eine Technologie-Bibliothek bereit, die sämtliche Standard- (Inverter, NAND, NOR mit 2 oder wesentlich mehr Dateneingängen) und auch Komplexgatter (z. B. Multiplexer) beinhaltet, von dem jeder Transistor per Hand gezeichnet und auf optimale Leistung hin bearbeitet wurde (und das mit Programmen, die überaus unhandlich in der Bedienung sind). Hierin besteht – neben dem Beherrschen einer jeden Lithographie-Stufe – die eigentliche Kunst. So führt beispielsweise AMDs 65-nm-Prozess im Vergleich zu Intels P1264 zu einem Cache mit größerem Platzbedarf.