Wie aufwändig wäre es denn, falls der Checksummer auf einen Doppelpunkt in einer Zeile trifft, auf anschließendes REM zu testen und dann ggf. die Checksumme nur für den Teil vor dem Doppelpunkt zu berechnen?
Siehe oben:
Dann genügt es aber nicht mehr, linear zu parsen und sich nur Status zu merken (wie "bin ich gerade in einem String?"), man muss auch nach vorne schauen -- oder anders gesagt, es gibt Kontext nicht mehr nur in eine Richtung sondern in beide. Das bedeutet leider, dass der Checksummer signifikant größer wird.
Machbar ist das, und das wäre der IMHO korrekte Weg, dieses Feature umzusetzen. Konkret: Leerzeichen werden sowieso übersprungen, aber man müsste bei jedem Doppelpunkt "vorauslesen" ob noch etwas anderes kommt außer Doppelpunkt, Leerzeichen und dem Token für "REM".
Ohne es auszuprobieren behaupte ich das kostet mindestens 20 Bytes. Da man den Checksummer ja erstmal abtippen muss halte ich das nicht für sinnvoll.