...man braucht genau 4 NOPs (oder eben andere 2-cycle Instruktionen wie bei dir, eben an genau der richtigen Stelle) um einen 7-cycle Jitter "aufzufangen". Wenn ich jetzt keinen Denkfehler habe sollten 3 NOPs sogar reichen WENN man garantiert keine "unintended Opcodes" verwendet -- die dokumentierten Opcodes brauchen maximal 7 cycles, damit ist die Wartezeit auf den IRQ irgendwo zwischen 8 (letzter Cycle einer Instruktion + eben 7 Cycles nächste Instruktion) und 2 (zwei letzte Cycles einer Instruktion) Cycles, der maximale Jitter also nur 6 Cycles...
Ich erinnere mich an eine krasse Diskussion auf der Csdb. Ich glaube, ein Teil eines Branches vor so einem Befehl kann auch noch mit dazuzählen.