Ehrlich gesagt, "nur" Bank-Switching für sich alleine ist programmtechnisch eine Angelegenheit, die ich mir äußerst ungern ans Bein binde. Es ist nicht nur schwierig zu nutzen (gibt z.B. viel Spaß, wenn man sich versehentlich eine Interrupt-Routine "aus-bank-t"), sondern kettet das Programm auch noch an spezielle Hardware, was den Nutzerkreis erheblich einschränkt.
Was mir erheblich besser taugt ist eine zugehörige Firmware, die das Extra-RAM als RAM-Disk anbietet. Das erlaubt dann z.B. das Programm (welches dann natürlich als Mehrteiler vorliegt) wahlweise von Floppy zu gebrauchen oder eben zuvor in die RAM-Disk zu verschieben, und das gibt dann auch einen erheblichen Geschwindigkeitsvorteil.
Vorausgesetzt die RAM-Disk ist sauber in den KERNAL eingehängt, kann man nun das eigene Programm im Vorfeld ganz 'normal' entwerfen, die gängigen Methoden zur Overlay-Thematik ziehen auch hier (was muß als statischer Part im Speicher bleiben, was wird - z.B. als "Leveldaten" - nachgeladen). Und, im Gegensatz zu einer Bank-Switching-Lösung, die wohl immer nur größere Speicherblöcke ummappen wird, hat man dann eine Granularität herunter bis auf Einzelbytes.
Für den VC-20 ist sowas schon gemacht worden: für die 512 KB RAM der FE3 gibt es eine RAM-Disk, die 480 KB des Extra-RAMs zur Verfügung stellt. Insofern ist für mich das Extra-RAM in der PU ein alter Hut, da gab es früher schon besseres/mehr, und das Extra-RAM in der PU ist wahrscheinlich auch nur ein Nebeneffekt davon, daß ein 'übergroßer' RAM-Chip benutzt wurde um die on-Board-Logik zur Dekodierung für +35K RAM einfacher zu machen.