IMHO ist das Problem, dass das Gross an Traffic immer noch TCP ist, und das ist halt recht OOO intolerant, i.d.R. reicht es ein Paket (N) 3-4 Pakete nach hinten zu schieben (so dass N+1 bis N+3 am Empfänger ankommen bevor N eintrudelt) diese lösen dann jeweils ein DupACK aus, also ein ACK Paket mit gleicher Acknowledgment number, und ab ~3-4 DupACKs geht der Sender von Datenverlust aus und reduziert sein congestion window, was effektiv die Datenrate reduziert. D.h. wenn TCP im Spiel ist, muss der Ent-Bonder letztlich die Reihenfolge wieder her stellen... im Prinzip kann man das so gestalten, dass man das selektiv nur fuer TCP macht, aber dazu muss man dann halt schon jedes Paket anfassen (was Prozessierungskosten verursacht) und man läuft in das Problem, dass z.B. ein UDP-Wireguard-Tunnel der selber überwiegend TCP transportiert fälschlicherweise nicht re-sequenziert wird. Mit anderen Worten wenn man nicht genau über die Traffic-Zusammensetzung informiert ist, ist es sicherer schlicht alle Pakete zu re-sequenzieren.
Aus diesem Grund wuenschen sich die Bitschubser, wie gesagt, dass neue Protokolle alle toleranter gegen out-of-order delivery werden... (IMHO ist das prinzipiell keine schlechte Idee, solange wir nur davon reden statt 3 dupACKs, z.B. 1-2 RTTs als Re-sequenzierungsfenster zu verwenden, aber das duerfte den Bitschubsern nur bedingt helfen). Das Problem dabei ist halt, dass ein Stream-Protokoll wie TCP Daten nur bis zum ersten Loch an die Applikation weiter gibt, d.h. die Anwendung ist bis zum Eintrudeln des ausstehenden Paketes blockiert, wenn ein Paket echt verloren war fuehrt RACK halt dazu, dass es zu etwa einer RTT extra Latenz kommt. Und das heisst dass es insgesamt besser ist, wenn das Backbone keine unnoetigen Sequenzaenderungen erzeugt.
Das ist ähnlich zum Memory-Odering Problem bei CPUs, fuer die Hardware-Macher sind schwächere Garantien einfacher (erlauben schnellere Implementierungen mit weniger Aufwand) während in Software stärkere Garantien effizienteren Code erlauben (wenn die Hardware entsprechend performant ist)... als Endkunde ist mir die Backbone/Hardware Seite weniger wichtig.