Ein kleinerer Fertigungsprozess bedeutet auch nicht das die Transistoren oder die anderen Komponenten in einem CPU/GPU-Die wirklich so klein sind oder sein müssen.
Das heißt am Ende nur das die Auflösung immer feiner wird, man also immer feinere Strukturen bauen kann. Man kann aus diesen kleineren Strukturen aber natürlich auch größere "Objekte" bauen.
Ein 14mn Prozess bedeutet halt das 14nm die kleinstmögliche Strukturbreite ist, aber nicht das alle Strukturen in einer CPU auch tatsächlich so klein sind.
Dann wächst die Anzahl an Transistoren von Generation zu Generation und damit der Energiebedarf.
Man muss sich vor Augen führen das die x86 Architektur seit Jahrzehnten quasi unverändert besteht und bis heute Grundlage der CPUs ist.
Lediglich umfangreiche Erweiterungen kamen immer wieder hinzu.
Erweiterungen für 64Bit Unterstützung (hat Intel damals von AMD übernommen), mehr interner Speicher/Cache, mehr Vernetzung untereinander, viele Instruktion-Sets, die früher vom allgemeinen Teil der CPU berechnet werden mussten, laufen heute über spezielle, eigene und damit auch schnellere Schaltungen. Controller für Schnittstellen wie den Arbeitsspeicher, den PCIe-Bus usw. Eine umfangreiche Out-of-Order Technik, mit der - grob gesprochen - möglicht exakt erraten werden soll welche Aufgaben wohl als nächstes zu erledigen sind. Eine immer größer werdende Parallelisierung, Hyper-Threading, mehr Rechenwerke, eine Funktion zur Überwachung der Temperatur und Stromaufnahme, um den Prozessor dynamisch unter-/übertakten zu können, eine integrierte Grafikfunktion, die auch immer leistungssärker wird uvm.
All das sorgt dafür das eine CPU immer größer wird und damit auch immer mehr Energie benötigt. Das versucht man durch Miniaturisierung zu kompensieren.
Es stimmt übrigens nicht das eine kleinere Strukturbreite immer in weniger Energiebedarf resultiert. Die Architektur muss an eine kleinere Fertigungsgröße angepast werden, es gibt mehr Leckströme, ein Übersprechen auf Nachbar-Leiterbahnen wird zum Problem usw.
Dann sollen die CPUs natürlich auch schneller werden und alleine durch eine höhere Taktfrequenz ergibt sich schon ein Mehrbedarf an Energie.
Mobile-CPUs sind einfach anders ausgelegt, manche Funktionen sind nicht vorhanden, die CPUs takten weiter herunter als Desktop-Modelle usw.
Was hat Intel gemacht als damals die erste Atom-CPU für Netbooks raus kam? Man hat einfach eine aktuelle Mobile-CPU genommen, die komplette Out-of-Order Funktion rausgeworfen und als Ersatz Hyper-Threading verbaut. Raus kam eine CPU mit einer für damalige Verhältnisse grandios niedrigen TDP. Aber das Ding hat dann halt auch nichts vom Teller gezogen.
Eine größerer Die ist auch schwieriger herzustellen. Die Ausbeute an voll funktionsfähigen Chips ist geringer.
AMD versucht das z.B. mit der Zen2 Architektur zu umgehen, indem ein Chiplet-Design genutzt wird, wo die Rechenwerke und der I/O-Teil getrennte Chips darstellen, die jeweils für sich einfacher und kostengünstiger zu produzieren sind.