Leserartikel Was wäre wenn

Was wäre, wenn
Der intel Tejas
intel Tejas Logo Vers.1.1-01.jpeg

Was wäre gewesen, wenn intel seinen Pentium 4 Nachfolger, Codename Tejas (HT+) und Cedarmill (2 Kerne) tatsächlich auf den Markt gebracht hätte?
Dies ist ein Bericht, wie ich es mir vorstelle.



Heute, am 13.11.2005 fiel endlich die NDA, bezüglich des heißersehnten Netburst Nachfolgers Tejas.
Damit wird auch der offizielle Name veröffentlicht, den intel Ausnahmsweise lange Geheimhalten konnte: Pentium Fiery – Feurig. Der Begriff Pentium ist bereits vom griechischen penta = 5 abgeleitet, insofern macht das Fiery schon Sinn.
Ob die CPU nur im Verbrauch oder auch in der Leistung Feuer macht, klärt dieser Test.

Aber erst noch ein Exkurs in die jüngere Vergangenheit:
Im November 2000 führte intel den Pentium IV ein, mit komplett neuer Architektur bereitete man sich auf das GHz Rennen weiter vor. Während der Athlon als erstes die 1 GHz Marke knackte, wollte man mit Netburst zumindest die 5 GHz Schallmauer als erstes durchbrechen.
Trotz seiner immer längeren Pipeline, die man von 20 auf 31 Stufen erhöhte, kann selbst der gerade eingeführte Prescott max. mit 3,8 GHz arbeiten. Auch der L2 Cache mit 1 MB hilft nicht zu spürbarer Mehrleistung, die den geringeren Takt ausgleicht - da kommt der Tejas genau richtig.
Intel hat vieles umgekrempelt, um das Ziel von 10 GHz wieder näher zu bringen. So wurde die Pipeline auf 40 Stufen erhöht, was zwar eine weiter geringere IPC bringt, aber dazu führt, dass die einfacheren Pipeline Stufen höher getaktet werden können. Zum Vergleich, AMD nutzt im Athlon 64 nur 12 und 17.
Auch der L1 Cache und die µOps wurden geändert, so bietet Tejas jetzt 24 KB L1 und 16.000 Instruktionen, anstatt 16 KB und 12.000. Der L2 Cache wurde auf 2 MB verdoppelt, ist schon für 3 MB designt und kann in 512 KB Schritten deaktiviert werden, Celeron lässt grüßen.
Die SSE3 Einheit wurde laut intel nur optimiert, genauso die FPU. Auch wenn SSE das mächtigere Werkzeug ist, hat man die bisher schwache FPU weiter optimiert, um ältere Programme zu beschleunigen, AMD hatte hier bis zu eine 950x höhere Geschwindigkeit, was man als Weltgrößter Prozessorhersteller nicht auf sich sitzen lassen wollte.
Und während sonst gerne automatisierte Tools zum Einsatz kommen, um die Transistoren zu platzieren, hat intel Ihr Design Team in Haifa vom derzeitigen Projekt abgezogen und es mit ans Reißbrett gesetzt. Nach dem Motto, vier frische Augen, sehen mehr als zwei alte hat man vieles händisch optimiert und natürlich auch den Erfahrungsschatz im Bereich Mobiles voll ausgenutzt.
So spricht intel dann auch bei gleichem Takt und identischer Fertigung von 10% Energieeinsparung. Zusammen mit der neuen Fertigung spart man 30% gegenüber dem alten Topmodell ein, und das bei 18% höheren Takt. Und was nicht in Wärme umgesetzt wird, muss auch nicht gekühlt werden. So hat man statt des 1,2kg Schweren Box Kühlers, der ursprünglich angedacht war, nur noch ein 700 Gramm schweres Geschoss, das im Test eindrucksvoll seine Effizienz gezeigt hat.
Seit Jahren ging die Verbrauchsspirale unaufhörlich weiter nach oben und damit auch die dB, der oftmals verbauten, kleinen Quirle.
Jetzt muss sich AMD fürchten, vor intels Lautlosigkeit. Selbst die eigenen Leute wissen nicht, wie leistungsfähig das neue System ist.
Neben der Optimierung kann der Prozessor auch noch seinen Takt senken, es sind zwar nur 2133 MHz im Minimum, dafür wird die Spannung von 1,45 V auf 1,25 V reguliert. Ebenfalls aus dem Mobil Bereich kommt die Abschaltung des L2 Caches, der mit seinen 2MB zu den Stromfressern zählt.
Technisch möglich kann man 1024 (leichter Workload), 512 (Office) und 1x 256 KB L2 Cache (10min IDLE) nach und nach abschalten. 256 KB bleiben dagegen dauerhaft aktiviert, um die Reaktionsfähigkeit des Systemes nicht zu stark zu beeinflussen. Nichts ist schlimmer, als unerfahrene Kunden, die über das sündteure System meckern, weil die Werte zu aggresiv gewählt wurden.
Noch sind die Treiber hier nicht ausgereift, intel sucht den optimalen Betriebspunkt zwischen Idle, Office und Gaming. Im Test hat sich gezeigt, dass eine Gedenksekunde auftritt, wenn der Rechner wieder den Takt anhebt und den L2 Cache zuschaltet. Wir konnten uns aber schnell dran gewöhnen, dafür entschädigt allein schon die Geräuschkulisse.

Tejas DIE Shot AMD.jpg



Auf der Chipsatz Seite hat sich auch einiges getan, so ist jetzt immer eine intel GMA 950 verbaut. Warum, fragt sich der geneigte Leser.
Auch hier stand das Stromspar Konzept im Vordergrund.
Ich möchte dabei auf den Artikel aus dem letzten Jahr
(// 22.05.2004//)
verweisen: Energieverbrauch aktueller Prozessoren

Das intel System mit Prescott hat im Idle immer noch 120 W gebraucht, 50% mehr als ein Clawhammer von AMD.
Mit der neuen Northbridge zieht dauerhaft eine Grafikkarte in das System ein. Einerseits macht man damit Office Rechner, die sonst von alten Geforce 4 MX oder FX 5200 bedient werden, obsolet. Andererseits will man auch hier den Hebel zum Stromsparen ansetzen. So erlaubt es das Mainboard und der entsprechende Treiber, die externe Grafikkarte komplett abzuschalten. Bisher ist es aber noch eine experimentelle Einbahnstraße, erst nach einem Neustart wird die Hauptkarte im PCIe Slot wieder aktiviert.
Der intel GMA 950 ist auch sehr konservativ getaktet, nur 250 MHz liegen an. Da er aber nur Windows befeuert und jetzt schon Windows Longhorn Ready ist, wird diese Leistung vollkommen reichen. Dazu sind 32 MB RAM über ein 64 Bit Speicherinterface direkt angeschlossen, die mit 333 MHz im DDR-Verfahren arbeiten, somit stehen dem Chip 5,4 GB/s an Bandbreite zur Verfügung. Zusätzlich kann er sich noch 64 MB vom Hauptspeicher reservieren, der max. 8,5 GB/s liefert. Im Apple iMac sind dagegen bis zu 224 MB geplant, die rein vom Mainboard RAM geliefert werden.
Ansonsten bietet die Northbridge alles, was Up to Date ist, etwa DDR II im Dual-Channel und asynchronen Betrieb, 6x USB 2.0 Anschlüsse, PCIe für die Grafikkarte, AGP entfällt dagegen, 5.1 Sound etc.

Die technischen Daten und vergleichbare Prozessoren finden sich im nächsten Abschnitt.

Tejas hypotetische Daten.jpg


Kommen wir nun zum Testsystem:

Die ältere Inno3D haben wir für diesen Test herangezogen, weil sie Aufgrund ihrer Konstruktion nahezu lautlos ist und trotzdem noch ausreichend Leistung liefert.

intel Tejas vs Pentium 4 DIE Shot-00.jpg


Aufgrund des nur kurzen Zeitraumes, der uns für den Test zustand, greifen wir bei Vergleichen auf ältere Tests zurück. So wie für die Radeon, deren Test erst am 5.10. war.

Testsystem AMD:
  • AMD Athlon 64 4000+ San Diego
  • Gigabyte GA-K8NXP-SLI
  • 2x512 MB Crucial Ballistix DDR 400 MHz
  • ATi Radeon X1800 XT
  • Nvidia Geforce 7800 GTX SLI
  • Samsung S-ATA 2-HDD mit 200 GB

  • AMD Athlon FX-53
  • Asus SK8V (Sockel 940, VIA K8T800
  • 2x512 MB DDR 400 MHz von Corsair
  • Western Digital 80 GB P-ATA HDD (8 MB Cache)


Benchmarks:
  • 3DMark 2001SE Ver.330
  • 3DMark 03 Ver.340
  • 7-Zip 3.13
  • Cinema 4D XL R9

Kommen wir zu den ersten Tests, dem 3DMark 2001 in geringer Auflösung, um das Grafikkarten Limit zu umgehen. Während mit der Radeon X1800 XT der AMD noch in Führung liegt, kann der Pentium beim SLI Gespann zeigen, welches Potential noch in diesem schlummert, 30.468 gegen 27.554 Punkte spricht eine knappe, aber klare Sprache.

3DMark 2001 u 03_1.jpg



Im 3DMark 03 haben wir die Geforce 6800 Cool VIVA genutzt, hier liegen die beiden Prozessoren dicht beieinander, die Grafikkarte begrenzt hier stärker. Uns war in diesem Test aber nicht die Leistung wichtig, sondern der subjektive Eindruck der Lautstärke. Während das AMD Gespann doch hörbar ist, vernimmt man vom intel Boxed Kühler nur ein sanftes Rauschen. Entsprechende Tests mit Meßgerät zur Lautstärken Messung wird nächsten Monat nachgereicht.

3DMark 2001 u 03_2.jpg



In den nachfolgenden 5 Tests ist dunkel Grün der Pentium Fiery und hell Grün das AMD Modell, was am nächsten liegt (Leistungs- oder Verbrauchsseitig).

Im Cinebench lässt der Pentium Fiery die versammelte Mannschaft hinter sich. Mit etwas Feintuning und ausgereifteren Treibern wird er seinen Vorsprung noch weiter ausbauen können.

Cinbench u 7Zip_1.jpg



Im 7-Zip Benchmark sind Pentium Fiery und die Pentium 4 Extreme Edition dicht beieinander, vermutlich grätscht hier die lange Pipeline des Neuankömmlings rein.

Cinbench u 7Zip_2.jpg




Kommen wir zu den Verbrauchswerten. Unser letzter Vergleich ist zwar bereits ein Jahr her, aber für Aufrüster wird er trotzdem hochinteressant sein.
Der Tejas kämpft hier mit dem Clawhammer um den ersten Platz.
Beeindruckend ist daher der Abstand zum nächsten Pentium, dem 2,4C Northwood, 75 zu 86 W steht es hier, 175 zu 55 Mio. Transistoren und 65 gegen 130nm, sowie eine TDP Einstufung von 85 zu 66 W.

Tejas Verbrauch_1.jpg



Auch unter Last, im Seti@home Benchmark zeigt sich die überlegene Fertigung und die Optimierungen, die das israelische Design Team durchgeführt hat. Vom Verbrauch nah am Northwood, bei überragender Mehrleistung.

Tejas Verbrauch_2.jpg



Und in der Parade Disziplin muss sich der Fiery knapp dem Athlon 64 3400+ geschlagen geben, wobei auch hier die Mehrperformance nicht unbeachtlich ist.

Tejas Verbrauch_3.jpg




Fazit: intel hat uns Eindrucksvoll bewiesen, dass das Gigahertz Rennen noch nicht beendet ist. Tejas gibt einen guten Ausblick auf den Dual-Core Cedarmill und den Samantha, ein Tejas+, der als Dual-Core mit HT geplant ist.
Hoffentlich wird intel die lange Pipeline nicht zum Verhängnis, AMD hatte zur Pentium 4 Einführung eindrucksvoll gezeigt, dass selbst mit 20% weniger Takt die Leistungskrone an die Athlons ging.
Wir sind aber optimistisch, dass gerade das verbesserte Hyper-Threading, in Version 3.0, selbst den zweiten Manchester Kern schlagen kann.
Genauso sicher ist aber auch, das AMD an einem entsprechenden Konter arbeitet. Die Gerüchteküche brodelt und der Toledo mit 1024 KB Cache pro Kern steht vor der Tür, dieser Kern auf 3,0 GHz wird es dem Pentium Fiery schwer machen.

Wir sind gespannt, was uns das neue Jahr bringen wird.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: The Sandman, wickedgonewild und konkretor
Was wäre, wenn
Intels Tejas Sackgasse

Pentium Five.jpg


Tatsächlich wurde das Projekt Tejas und Cedarmill wirklich spät gecancelt. Der Chip hatte schon das Tape Out hinter sich, als das „Stop“ kam.
Im Nachhinein ein absoluter Glücksgriff für Intel, da sich die neuen Core CPUs schon kurz nach erscheinen bewährten und dies bis heute tun.
Für AMD dagegen war es ein Tiefpunkt, da die späteren CPU-Architekturen immer weiter hinter die Cores fielen. Erst mit den Zen CPUs konnte man wieder in Schlagweite gelangen.

Nachfolgend nochmal die gesicherten Daten, zum Pentium 5. Man könnte jetzt, Aufgrund der Transistor Dichte späterer Modelle und Intels Prinzip des inklusiven L1/2-Caches auf einen möglichen L3-Cache und die benötigten Transistoren schließen.

Tejas gesicherte Daten.png


Was denkt Ihr darüber?
Und habt Ihr von dem Projekt schon einmal gehört?

Soweit keine Angabe unter den Bildern ist, bin ich der Urheber.
 
  • Gefällt mir
Reaktionen: SVΞN, konkretor, Ltcrusher und 3 andere
Interessant wäre hier ein Vergleich mit dem Pentium M, denn die Core 2 Architektur basiert nach meinem Wissen stark auf eben dem Pentium M.
 
  • Gefällt mir
Reaktionen: lord_mogul
Dieses Diagramm veranschaulicht gut, vor welchen Herausforderungen die Herstellern standen.


2021-03-16 (1).png


Das ist aus einer Pdf des Los Alamos National Laboratory (LA-UR-05-0936)
 
  • Gefällt mir
Reaktionen: The Sandman, konkretor und wickedgonewild
Von dem was ich so mit meinem P4 631 (3,0 GHz, Cedar Mill, 65nm) und diversen Core 2 Chips gesehen hab (Insbesondere ein Celeron 440), hätte NetBurst vor allem viel mehr Bandbreite gebraucht.

Bei dem 631 lässt sich der Multi von 15x auf 12x absenken, wenn dann der FSB entsprechend angehoben wird kommt man wieder auf die gleichen 3,0 GHz Takt.
Und von 15x200 mit DDR2-400 auf 12x250 mit DDR2-833 gibt knapp 15% mehr Leistung in so ziemlich allem was ich getestet hab.

Also ein "Pentium 5" mit deutlich mehr Cache (so in Richtung 3-4-6 MB) und mehr externer Bandbreite (Statt 200 MHz/800 MT/s FSB eher sowas wie 533 MHz/2133 MT/s plus schneller Speicher) hätte da sicherlich geholfen, auch ohne die Architektur zu verändern.
 
  • Gefällt mir
Reaktionen: andi_sco
Wäre da nicht der extreme Stromverbrauch gewesen.
Da ist es interessant, wie ein Pentium D 915 abschneidet, den Takt erreiche ich fast mit einem Pentium E2140, bei angenehm, kühlen Temperaturen.
 
Hab nicht auf den tatsächlichen Verbrauch geschaut, aber selbst mit höherem FSB wird der 631 immernoch vom 2 GHz Celeron 440 geschlagen. Trotz 4x Cache und HT. Der einzige Test wo der Cedar Mill vorne liegt war 3DMark Vantage, und das auch nur mit 3%
Wenn ich beiden Dampf mache (3 GHz (10x300) auf dem Celeron, 4 GHz auf dem P4 (12x334)) liegt der NetBurst vorne, aber der kleine Conroe-L läuft auch auf 3,5, und dann ist das ganze doch wieder recht knapp. Auf gleichem Takt liegt der Celeron mal eben 50-60% vorne, und das bei weniger als der Hälfte des Verbrauchs. (laut TDP 35W vs 86W, sollte also selbst im ungünstigen fall immernoch schneller sein für weniger strom)

Hab keinen Pentium D da, aber wenn ich sehe wie wenig die kleinen Core-based Celeron und Pentium schlucken, wird das schon eng.
 
  • Gefällt mir
Reaktionen: andi_sco
Hier gibt es weitere, realere Informationen zu dem Tejas:
 
Zuletzt bearbeitet: (Original Video verlinkt)
Zurück
Oben