Das jeder Kern wie beim Dual-Core A64 seinen eigenen Cache hat, ist die einfacherer zu realisierende Lösung.
Ganz einfach deswegen, dass beim geteilten Cache das Cache-Managment ständig garantieren muss, dass ein Kern auf die gerade genutzten Speicherzellen exklusiven Zugriff hat und der andere Kern nicht das Recht hat, Werte im Speicher zu verändern, die der erste Kern noch für die Berechnung benötigt. Sonst würde das reinste Chaos ausbrechen bzw keine Rechnung mehr könnte ausgeführt werden, da sich beide Recheneinheit sich gegenseitig die Werte verfälschen würden.
Bei zwei eigenen Caches hätte man das Problem, dass man garantieren muss, dass die Daten, die von beiden Kernen gelesen werden können, im RAM erhalten bleiben. Ist im Endeffekt beides nicht gerade ohne. Am Ende werden nur die ersten Tests zeigen, wer die Aufgabe besser gelöst hat.