Code für bitweises Verschieben von Character a -> b optimieren

aitsch · 30. Oktober 2019

Moin,

ich schreibe gerade ein Spiel für den VC20. Da es hier keine Sprites gibt, werden alle Spielergrafiken als Characterzeichen dargestellt und bei Bewegung bitweise auf ihr Ziel verschoben.

Jede Figur hat ein fest zugewiesenes Characterzeichen (hier A) und für die Bewegungsanimation jeweils ein festes Zeichen, dass für das Verschieben benutzt wird (hier B).

Bewegt sich die Figur nicht, wird sie immer nur mit dem Zeichen A abgebildet.

B ist immer %00000000 und dient nur als temporäres Zeichen um die bittweise Verschiebung abzubilden.

Jede Figur bindet also immer ein Characterpärchen (AB, CD, EF,...).

Der Bewegungsablauf findet über diese 5 Schritte statt:

B wird auf die Zielposition geschrieben
Die Bewegung wird durchgeführt (siehe Code)
Auf dem BS wird B durch A ersetzt
Die ursprünglichen Bits werden von B auf A zurückkopiert (unsichtbar)
Alle Bits auf B werden gelöscht (unsichtbar).

Das ist nötig weil der Character, wenn er sich nicht bewegt, immer das Zeichen A abgebildet wird.

Hier mein Codeschnipsel, mit dem ich die Bewegungen Hoch, Runter, Rechts, Links abbilde.

Es funktioniert so, dass ich das aktuelle Characterzeichen über die Zeropage (zp) auf ein Zielzeichen (zp2) bitreise verschiebe.

Also, Zeichen A wandert Bit für Bit auf Zeichen B.

Code

!zone shift_char2tmp ; Dieser Code wird pro Zeichen 8x durchlaufen !!!!!!!!!!!!!!!!!!!
shift_char2tmp lda ACTION
bne .shift_char2tmp
rts
.shift_char2tmp lda #$18 ; High Byte für die Adressen
sta zp+1
sta zp2+1
ldy character_no
lda lowbyte_tmp,y
sta zp2 ; LowByte für das Ziel
lda lowbyte_char,y
sta zp ; LowByte für die Ausgangsposition
ldy #7
lda DIR ; Bewegungsrichtung laden
; -------- rechts --------
.player_dir_right cmp #RECHTS
bne .player_dir_left
.scroll_r lda (zp),y
lsr
php
sta (zp),y
lda (zp2),y
plp
ror
sta (zp2),y
dey
bpl .scroll_r
jmp .end
; -------- links --------
.player_dir_left cmp #LINKS
bne .player_dir_down
.scroll_l lda (zp),y
asl
php
sta (zp),y
lda (zp2),y
plp
rol
sta (zp2),y
dey
bpl .scroll_l
jmp .end
; -------- runter --------
.player_dir_down cmp #UNTEN
bne .player_dir_up
.scroll_d
ldy #7
lda (zp),y ; Byte 7 ...
tax ; ... auf X zwischenspeichern
dey
.loop_down lda (zp),y ; hole CHAR-Zeile 6 ...
pha ; ... auf den Stack
lda (zp2),y ; hole TMP-Zeile 6 ...
iny
sta (zp2),y ; ... speichere sie auf 7
pla ; hole TMP-Zeile vom Stack...
sta (zp),y ; ... speichere sie auf CHAR-7
dey
dey
bpl .loop_down
ldy #0
txa ; Byte 7 aus dem X-Reg ...
sta (zp2),y ; ... auf Ziel Byte 0 schreiben
tya
sta (zp),y
jmp .end
; -------- hoch --------
.player_dir_up cmp #OBEN
ldy #0
lda (zp),y ; Byte 0 ...
tax ; ... auf X zwischenspeichern
iny
.loop_up lda (zp),y ; hole CHAR-Zeile 1 ...
pha ; ... auf den Stack
lda (zp2),y ; hole TMP-Zeile 1 ...
dey
sta (zp2),y ; ... speichere sie auf 0
pla ; hole TMP-Zeile vom Stack...
sta (zp),y ; ... speichere sie auf CHAR-0
iny
iny
cpy #8
bne .loop_up
ldy #7
txa ; Byte 0 aus dem X-Reg ...
sta (zp2),y ; ... auf Ziel Byte 7 schreiben
lda #0
sta (zp),y ; Byte 0 vom CHAR löschen
.end rts

Alles anzeigen

Nicht wundern, die Funktion verschiebt das Zeichen immer nur um einen Pixel je Richtung, wird aber 8 mal durchlaufen.

Der Code funktioniert, fühlt sich aber umständlich an.

Aktuell benötige ich hierfür 145 Bytes.

Wie lässt sich diese Funktion optimieren und verkürzen?

Hoffentlich konnte ich mein "Konzept" hier verständlich beschreiben.

aitsch

Mac Bacon · 30. Oktober 2019

Auf PHP:PLP kann man hier verzichten. Interessant ist ja nur das Carry-Bit, und das wird von LDA/STA nicht beeinflusst.

aitsch · 30. Oktober 2019

Danke, ist geändert.

aitsch

P.S.: Oh Mann ... Character im Titel ohne "h" geschrieben . Das kratzt wieder am Image.

gamersince1984 · 30. Oktober 2019

Braucht man für die flüssige Bewegung, wenn es breiter als ein Bit ist, nicht immer zwei Zeichen zur Darstellung?

Ich suche schon länger, nach einer brauchbaren Lösung für Softwaresprites auf dem VC-20.

Neptun · 30. Oktober 2019

Hallo aitsch,

probier' mal das:

lda #$18

sta adr1+2

sta adr2+2

ldy character_no

lda lowbyte_tmp,y

sta adr2+1

lda lowbyte_char,y

sta adr1+1

ldx #7

lda dir

;rechts

cmp #rechts

bne .player_dir_left

.scroll-r

adr1 lsr $ffff,x

adr2 ror $ffff,x

dex

bpl .scroll_r

bmi .end

Gruß,

Neptun

spacer · 30. Oktober 2019

Hallo, guten Tag.

Ist ja interessant was du da so programmierst.

Ich Spiele mit dem Vice-VIc20 und dem Vforth und dem MOSpeed.

Als den VIC20 habe ich den MiSter mit dem Vic20-Core.

Ich fand für den VIC20 keine so richtige Programmiersprache. Das Basic ist in der Grafik nicht so schnell , weil die Darstellung ja nicht in drei Schritten gemacht werden kann beim Vic20. Ist da schon komplizierter. Das MOSpeed stellt zb aus dem normalen Basic des Vic20 eine ASM her. Ist schon angenehm schnell.

Und das VForth hat mich mal interessiert (die Grafik im Bild ist vom Vforth) , ich wollte mal Grafik mit Text mischen und ist mir da nicht schwer gefallen.

Ich kannte Forth von vor über 30 Jahren.

Reines ASM wie bei dir ist nicht so mein Ding.

Ich bin gerade dabei über die RS232 mit dem Vice und dem Vic20 Daten nach Draussen zu schicken und von Draussen wieder zu dem Vic20 mit dem Netzwerk. Klappt wunderbar. Das Vforth macht das auch mit , war sehr erstaunt.

Mich würde mal interessieren wie dein ASM-Code aussieht.

Mein Programm mit Vforth :

Code

: getbad
dup 16 / 336 * swap 15 and +
swap 8 / 16 * + 4352 + ;
create bmask
128 c, 64 c, 32 c, 16 c, 8 c, 4 c, 2 c, 1 c,
: plot
over swap
getbad swap 7 and bmask + c@
over c@
or swap c! ;
: grafikscr
8048 4352 do 0 i c! loop
151 36867 c! 21 36866 c! 204 36869 c! 14 36864 c!
255 16 do i i 4096 16 - + c! loop
255 16 do 6 i 37888 16 - + c! loop ;
: text
12 36864 c! 22 36866 c! 174 36867 c! 192 36869 c! ;
create sintable
0000 ,
0175 , 0349 , 0523 , 0698 , 0872 , 1045 , 1219 , 1392 , 1564 , 1736 ,
1908 , 2079 , 2250 , 2419 , 2588 , 2756 , 2924 , 3090 , 3256 , 3420 ,
3584 , 3746 , 3907 , 4067 , 4226 , 4384 , 4540 , 4695 , 4848 , 5000 ,
5150 , 5299 , 5446 , 5592 , 5736 , 5878 , 6018 , 6157 , 6293 , 6428 ,
6561 , 6691 , 6820 , 6947 , 7071 , 7193 , 7314 , 7431 , 7547 , 7660 ,
7771 , 7880 , 7986 , 8090 , 8192 , 8290 , 8387 , 8480 , 8572 , 8660 ,
8746 , 8829 , 8910 , 8988 , 9063 , 9135 , 9205 , 9272 , 9336 , 9397 ,
9455 , 9511 , 9563 , 9613 , 9659 , 9703 , 9744 , 9781 , 9816 , 9848 ,
9877 , 9903 , 9925 , 9945 , 9962 , 9976 , 9986 , 9994 , 9998 , 10000 ,
: s180 ( n-> n . returns sine, 0-180 degrees)
dup 90 > ( if greater than 90 degrees,)
if 180 swap - then ( subtract from 180)
2* sintable + @ ( then take sine)
;
: sin ( n -> sine, return sine of any number of degrees)
360 mod ( bring within + or - 360)
dup 0< if 360 + then ( if negative, add 360)
dup 180 > ( test if greater than 180)
if 180 - s180 negate ( if so, subtract 180, negate sine)
else s180 then ( otherwise, straightforward)
;
: cos ( n cosine.)
360 mod ( prevent overflow near 32,767)
90 + sin ; ( cosine is sine with 90 degrees phase shift)
: plotsin
336 0 do i 2 / i sin 70 10000 */ 90 + plot 2 +loop ;
: plotcos
336 0 do i 2 / i cos 70 10000 */ 90 + plot 2 +loop ;
: gehe
grafikscr
plotsin
plotcos
8 0 do i 32768 + 8 + c@ 4352 i + c! loop
5 37888 c!
8 0 do i 32768 + 16 + c@ 4352 16 + i + c! loop
3 37889 c!
8 0 do i 32768 + 24 + c@ 4352 32 + i + c! loop
0 37890 c!
key . text ;

Alles anzeigen

Danke.

GRuss

Jotta · 30. Oktober 2019

Zitat von aitsch

Jede Figur bindet also immer ein Characterpärchen (AB, CD, EF,...).

Sprites hatte ich auch mal von Hand programmiert, alleine um

mal zu sehen, was der VIC-II so alles mit wenigen

Registerzugriffen leistet. Von daher habe ich eine Vorstellung,

wie das in Assembler programmiert werden kann. Was ich bei

deinem Ansatz (AB,CD,etc. und Bewegung in alle Richtungen)

nicht verstehe, wie du mit nur 2 Zeichen je 8x8-Sprite

auskommst. Ich würde 4 Zeichen AB-CD nehmen und darin

das Sprite ablegen:

- (1) In 16 Bytes (z.B.ZeroPage) wird zuerst das Sprite in die

gewünschte Richtung geshiftet (x-Position Modulo x08)

- (2) in die 4 Zeichen AB-CD werden die 2x2-Zeichen

(X00,X10,X01,X11) reinkopiert (X00,.. sind die 4 Zeichen, die

von dem Sprite abgedeckt werden)

- (3) in die 4 Zeichen AB-CD werden dann die geshifteten

Spritebytes reingeodert

- (4) die 4 Zeichen AB-CD überschreiben die 2x2-Zeichen Xij

Der Ansatz hat den Vorteil, dass auch Sprite-Background

Kollisitonen als auch Sprite-Sprite-Kollisionen ergänzt werden

können. Aufwand:

- (1) 16+x Ops (x: Overhead für ZP-Init, vlt. 4-8 Ops)

- (2) 32+x Ops (x: evtl. für Schleife, ZP-Init, vlt. 10 Ops)

- (3) 16+x Ops (x: Schleife, ZP-Init, vlt. 5-10 Ops)

- (4) 4+x Ops (x: Position von Xij bestimmen, ZP-basiert,vlt 10 Ops)

ergibt ca. 60+y ~= 60+40 <= 100 Operations (ohne Collision-Detection).

Falls mehrere Sprites gewünscht sind, dann würde ich je

angezeigtem Sprite 4 Zeichen reservieren: Dein Background

hat z.B. 240 Zeichen, bleiben 16=4*4 Zeichen für insgesamt

4 Sprites. Die Sprites werden nacheinander gezeichnet,

wobei für Sprite2 Xij dann auch AB-CD von Sprite1 umfassen

kann.

Im Extremfall muss für ein Sprite sieben mal geshiftet werden,

hier würde ich ein Sprite in 2 Ausprägungen abspeichern:

einmal ungeshiftet, einmal um 4 Bits geshiftet (in x-Richtung).

Damit ist die max Anzahl Shiftoperationen je Byte auf 3 Shifts

begrenzt.

JeeK · 30. Oktober 2019

Zitat von aitsch

Moin,

ich schreibe gerade ein Spiel für den VC20. Da es hier keine Sprites gibt, werden alle Spielergrafiken als Characterzeichen dargestellt und bei Bewegung bitweise auf ihr Ziel verschoben.

Jede Figur hat ein fest zugewiesenes Characterzeichen (hier A) und für die Bewegungsanimation jeweils ein festes Zeichen, dass für das Verschieben benutzt wird (hier B).

Bewegt sich die Figur nicht, wird sie immer nur mit dem Zeichen A abgebildet.

B ist immer %00000000 und dient nur als temporäres Zeichen um die bittweise Verschiebung abzubilden.

Jede Figur bindet also immer ein Characterpärchen (AB, CD, EF,...).

Der Bewegungsablauf findet über diese 5 Schritte statt:

B wird auf die Zielposition geschrieben

Die Bewegung wird durchgeführt (siehe Code)

Auf dem BS wird B durch A ersetzt

Die ursprünglichen Bits werden von B auf A zurückkopiert (unsichtbar)

Alle Bits auf B werden gelöscht (unsichtbar).

Das ist nötig weil der Character, wenn er sich nicht bewegt, immer das Zeichen A abgebildet wird.

Hier mein Codeschnipsel, mit dem ich die Bewegungen Hoch, Runter, Rechts, Links abbilde.

Es funktioniert so, dass ich das aktuelle Characterzeichen über die Zeropage (zp) auf ein Zielzeichen (zp2) bitreise verschiebe.

Also, Zeichen A wandert Bit für Bit auf Zeichen B.

Code

!zone shift_char2tmp ; Dieser Code wird pro Zeichen 8x durchlaufen !!!!!!!!!!!!!!!!!!!

shift_char2tmp lda ACTION

bne .shift_char2tmp

rts

.shift_char2tmp lda #$18 ; High Byte für die Adressen

sta zp+1

sta zp2+1

ldy character_no

lda lowbyte_tmp,y

sta zp2 ; LowByte für das Ziel

lda lowbyte_char,y

sta zp ; LowByte für die Ausgangsposition

ldy #7

lda DIR ; Bewegungsrichtung laden

; -------- runter --------

.player_dir_down cmp #UNTEN

bne .player_dir_up

.scroll_d

ldy #7

lda (zp),y ; Byte 7 ...

pha ; ... am Stack zwischenspeichern

dey

.loop_down lda (zp),y ; hole CHAR-Zeile 6 ...

tax ; ... zwischenspeichern

lda (zp2),y ; hole TMP-Zeile 6 ...

iny

sta (zp2),y ; ... speichere sie auf 7

txa ; hole TMP-Zeile aus Zwischenspeicher ...

sta (zp),y ; ... speichere sie auf CHAR-7

dey

dey

bpl .loop_down

iny ; $FF -> $00

pla ; Byte 7 vom Stack ...

sta (zp2),y ; ... auf Ziel Byte 0 schreiben

tya ; $00

sta (zp),y

jmp .end

Alles anzeigen

Alles anzeigen

Für "down" und "up" würde ich vorschlagen den Zwischenspeicher in der Schleife mit Register X zu machen, statt am Stack und das jeweilige Rand-Byte auf den Stack zu legen. PHA/PLA braucht 7 Zyklen, während TXA/TAX nur 4 braucht. Da spart man schon mal 3x6 Takte.

Warum wird eigentlich (zp),y für y=0 von y=7 übernomen, bei zp2 aber nicht?

JeeK · 30. Oktober 2019

Zitat von spacer

Ich Spiele mit dem Vice-VIc20 und dem Vforth und dem MOSpeed.

[..]

Ok, aber das hat mit dem Thema nicht wirklich zu tun bzw. schweift schon ziemlich ab. Wir sollten vielleicht beim ursprünglichen Thema bleiben.

gamersince1984 · 30. Oktober 2019

Zitat von Jotta

Zitat von aitsch

Jede Figur bindet also immer ein Characterpärchen (AB, CD, EF,...).

Sprites hatte ich auch mal von Hand programmiert, alleine um

mal zu sehen, was der VIC-II so alles mit wenigen

Registerzugriffen leistet. Von daher habe ich eine Vorstellung,

wie das in Assembler programmiert werden kann. Was ich bei

deinem Ansatz (AB,CD,etc. und Bewegung in alle Richtungen)

nicht verstehe, wie du mit nur 2 Zeichen je 8x8-Sprite

auskommst. Ich würde 4 Zeichen AB-CD nehmen und darin

das Sprite ablegen:

- (1) In 16 Bytes (z.B.ZeroPage) wird zuerst das Sprite in die

gewünschte Richtung geshiftet (x-Position Modulo x08)

- (2) in die 4 Zeichen AB-CD werden die 2x2-Zeichen

(X00,X10,X01,X11) reinkopiert (X00,.. sind die 4 Zeichen, die

von dem Sprite abgedeckt werden)

- (3) in die 4 Zeichen AB-CD werden dann die geshifteten

Spritebytes reingeodert

- (4) die 4 Zeichen AB-CD überschreiben die 2x2-Zeichen Xij

Der Ansatz hat den Vorteil, dass auch Sprite-Background

Kollisitonen als auch Sprite-Sprite-Kollisionen ergänzt werden

können. Aufwand:

- (1) 16+x Ops (x: Overhead für ZP-Init, vlt. 4-8 Ops)

- (2) 32+x Ops (x: evtl. für Schleife, ZP-Init, vlt. 10 Ops)

- (3) 16+x Ops (x: Schleife, ZP-Init, vlt. 5-10 Ops)

- (4) 4+x Ops (x: Position von Xij bestimmen, ZP-basiert,vlt 10 Ops)

ergibt ca. 60+y ~= 60+40 <= 100 Operations (ohne Collision-Detection).

Falls mehrere Sprites gewünscht sind, dann würde ich je

angezeigtem Sprite 4 Zeichen reservieren: Dein Background

hat z.B. 240 Zeichen, bleiben 16=4*4 Zeichen für insgesamt

4 Sprites. Die Sprites werden nacheinander gezeichnet,

wobei für Sprite2 Xij dann auch AB-CD von Sprite1 umfassen

kann.

Im Extremfall muss für ein Sprite sieben mal geshiftet werden,

hier würde ich ein Sprite in 2 Ausprägungen abspeichern:

einmal ungeshiftet, einmal um 4 Bits geshiftet (in x-Richtung).

Damit ist die max Anzahl Shiftoperationen je Byte auf 3 Shifts

begrenzt.

Alles anzeigen

Ja. Das macht Sinn.

JeeK · 30. Oktober 2019

Zitat von Neptun

lda #$18

sta adr1+2

sta adr2+2

ldy character_no

lda lowbyte_tmp,y

sta adr2+1

lda lowbyte_char,y

sta adr1+1

ldx #7

lda dir

Alles anzeigen

Der Ansatz als selbstmodifizierender Code sollte aber auch den scroll_l-Teil berücksichtigen, also

lda #$18

sta adr1+2

sta adr2+2

ldy character_no

lda lowbyte_tmp,y

sta adr2+1

sta adr4+1

lda lowbyte_char,y

sta adr1+1

sta adr3+1

ldx #7

...

.scroll_l

adr3 lsl $ffff,x

adr4 rol $ffff,x

Für down/up wären dann, wenn man das auch so macht auch noch weitere Adressen nötig, die zu manipulieren wären.

Das könnte man aber auch bereits selektiv abhängig von "dir" machen, damit für eine Bewegung nicht auf Verdacht alle 4 Code-Teile modifiziert werden.

ldy #7

ldx #6

adr5_c lda $ffff,y

pha

.scroll_d

adr6_c lda $ffff,x

adr7_c sta $ffff,y

adr8_t lda $ffff,x

adr9_t sta $ffff,y

dey

dex

bpl .scoll_d

tya ; 0

adr10_t sta $ffff,y

pla

adr11_c sta $ffff,y

Da muss man halt an recht vielen Stellen patchen ... da wäre wie oben schon erwähnt ein selektives Vorgehen abhängig von der Richtung schon ganz praktisch.

spacer · 30. Oktober 2019

Warum macht ihr euch das Leben schwer.

Ich habe oben meine Demo vom Vforth als Grundlage gezeigt. Mindestens 8KB erweiterung beim Vice einstellen.

Ihr geht in den Grafikmodus vom Vic20. Die Startadresse dort ist dann oben links 4352.

Jedes Zeichen im Grafikmodus hat eine Höhe von 16 Byte dann geht es weiter nach rechts.

Ich habe oben die Buchstaben ab Adresse 4352 gesetzt , nach 8 Byte habe ich 8 dazu gezählt damit der 2 Buchstabe daneben ist ansonsten wären es 16 Byte untereinander. Der Farbram beginnt bei 37888 und geht untereinander über 16 Byte.

Jetzt braucht ihr nur noch mit ROL, ROR, ASL und LSR spielen.

Ist doch einfacher als sich wie oben mit dem Characterzeichen rumzuquälen.

Außerdem könnt ihr noch Grafik reinbringen für den Augenschmaus.

Dieses Bild zeigt , wenn ich 16 Byte hintereinander setze , AB CD.

Gruss

aitsch · 31. Oktober 2019

Zitat von Neptun

Hallo aitsch,

probier' mal das:

lda #$18

sta adr1+2

sta adr2+2

ldy character_no

lda lowbyte_tmp,y

sta adr2+1

lda lowbyte_char,y

sta adr1+1

ldx #7

lda dir

;rechts

cmp #rechts

bne .player_dir_left

.scroll-r

adr1 lsr $ffff,x

adr2 ror $ffff,x

dex

bpl .scroll_r

bmi .end

Gruß,

Neptun

Alles anzeigen

Das ist genial. Eigentlich total einfach zu verstehen aber ich bin von selbst nicht drauf gekommen.

Ich dachte, das Potential zum Optimieren liegt in der Auf- und Abwärtsbewegung.

Mit rechts/links war ich schon recht zufrieden.

Vielen Dank!!!

Zitat von Jotta

Sprites hatte ich auch mal von Hand programmiert, alleine um

mal zu sehen, was der VIC-II so alles mit wenigen

Registerzugriffen leistet. Von daher habe ich eine Vorstellung,

wie das in Assembler programmiert werden kann. Was ich bei

deinem Ansatz (AB,CD,etc. und Bewegung in alle Richtungen)

nicht verstehe, wie du mit nur 2 Zeichen je 8x8-Sprite

auskommst. Ich würde 4 Zeichen AB-CD nehmen und darin

das Sprite ablegen:

- (1) In 16 Bytes (z.B.ZeroPage) wird zuerst das Sprite in die

gewünschte Richtung geshiftet (x-Position Modulo x08)

- (2) in die 4 Zeichen AB-CD werden die 2x2-Zeichen

(X00,X10,X01,X11) reinkopiert (X00,.. sind die 4 Zeichen, die

von dem Sprite abgedeckt werden)

- (3) in die 4 Zeichen AB-CD werden dann die geshifteten

Spritebytes reingeodert

- (4) die 4 Zeichen AB-CD überschreiben die 2x2-Zeichen Xij

Der Ansatz hat den Vorteil, dass auch Sprite-Background

Kollisitonen als auch Sprite-Sprite-Kollisionen ergänzt werden

können. Aufwand:

- (1) 16+x Ops (x: Overhead für ZP-Init, vlt. 4-8 Ops)

- (2) 32+x Ops (x: evtl. für Schleife, ZP-Init, vlt. 10 Ops)

- (3) 16+x Ops (x: Schleife, ZP-Init, vlt. 5-10 Ops)

- (4) 4+x Ops (x: Position von Xij bestimmen, ZP-basiert,vlt 10 Ops)

ergibt ca. 60+y ~= 60+40 <= 100 Operations (ohne Collision-Detection).

Falls mehrere Sprites gewünscht sind, dann würde ich je

angezeigtem Sprite 4 Zeichen reservieren: Dein Background

hat z.B. 240 Zeichen, bleiben 16=4*4 Zeichen für insgesamt

4 Sprites. Die Sprites werden nacheinander gezeichnet,

wobei für Sprite2 Xij dann auch AB-CD von Sprite1 umfassen

kann.

Im Extremfall muss für ein Sprite sieben mal geshiftet werden,

hier würde ich ein Sprite in 2 Ausprägungen abspeichern:

einmal ungeshiftet, einmal um 4 Bits geshiftet (in x-Richtung).

Damit ist die max Anzahl Shiftoperationen je Byte auf 3 Shifts

begrenzt.

Alles anzeigen

Danke für die umfangreiche Beschreibung. Allerdings bilde ich keine Sprites nach (2x2 Characters) sondern eine Figur besteht nur aus 1 Character.

Aber zum Schluss soll es einen Boss geben. Der besteht aus 2x2 Characters.

Dann muss ich nochmal neu nachdenken aber ich will (noch) nicht an meinem Grundkonzept rütteln.

Ich müsste dann fast den ganzen Code ändern.

Trotzdem Vielen Dank

Zitat von JeeK

Für "down" und "up" würde ich vorschlagen den Zwischenspeicher in der Schleife mit Register X zu machen, statt am Stack und das jeweilige Rand-Byte auf den Stack zu legen. PHA/PLA braucht 7 Zyklen, während TXA/TAX nur 4 braucht. Da spart man schon mal 3x6 Takte.

Warum wird eigentlich (zp),y für y=0 von y=7 übernomen, bei zp2 aber nicht?

PHA/PLA war gar nicht notwendig und sind schon aus dem Code entfernt worden. Aber Vielen Dank für Deine Antwort.

---------------------------------------------------------------------------------------------------------------------------------------------------

Nun zum aktuellen Stand der Dinge

---------------------------------------------------------------------------------------------------------------------------------------------------

Die aktuelle Codeversion sieht jetzt so aus:

Code

!zone shift_char2tmp
shift_char2tmp lda ACTION
bne .shift_char2tmp
rts
.shift_char2tmp lda #$18 ; High Byte für die Adressen
sta zp+1
sta zp2+1
sta adr1+2
sta adr2+2
ldy character_no
lda lowbyte_tmp,y
sta zp2 ; LowByte für das Ziel
sta adr2+1
lda lowbyte_char,y
sta zp ; LowByte für die Ausgangsposition
sta adr1+1
lda DIR ; Bewegungsrichtung laden
; -------- runter --------
... ; noch nicht geändert
; -------- rauf --------
... ; noch nicht geändert
.player_dir_r_l
; -------- rechts oder links --------
; OP Codes für rechts: lsr $5e; ror $7e
; OP Codes für links: asl $1e; rol $3e
ldx #$5e ; OP Code für rechts (lsr)
ldy #$7e ; OP Code für rechts (ror)
cmp #RECHTS
beq .start_shift
ldx #$1e ; OP Code für links (asl)
ldy #$3e ; OP Code für links (rol)
.start_shift stx adr1
sty adr2
ldx #7
ldy #7
lda DIR
; shifte bytes (rechts/links)
.scroll_r_l
adr1 lsr $ffff,x
adr2 ror $ffff,x
dex
bpl .scroll_r_l
.end rts

Alles anzeigen

Ich bin jetzt runter auf 116 Bytes.

Das ist erstmal nur eine Übergangsversion, weil ich bei hoch/runter noch keine Änderungen vorgenommen habe und die Ursprungslösung (h/r)und die neue Lösung (r/l) noch nicht aufeinander abgestimmt sind. Habe bis zum WE nicht die Zeit dafür.

Aber die rechts/links-Bewegung laufen jetzt in einer einzelnen Routine ab und ist mir nur noch 34 Bytes wahrscheinlich unschlagbar kompakt.

Hat noch jemand eine gute Idee für hoch/runter ?????

( JeeK: Deinen Vorschlag muss ich am WE noch etwas genauer studieren)

Danke an alle Beteiligten

aitsch

spacer · 31. Oktober 2019

Die Bewegungen in den 2 Byte sind nicht so schwer.

Den Hintergrund abfragen und eine Collision bzw den Character richtig setzen mit der Farbe verbraucht einigen ASM-Code.

Es gibt darüber für den Vic20 guten Bücherhinweise als PDF.

Gruss

gamersince1984 · 31. Oktober 2019

Zitat von spacer

Die Bewegungen in den 2 Byte sind nicht so schwer.

Den Hintergrund abfragen und eine Collision bzw den Character richtig setzen mit der Farbe verbraucht einigen ASM-Code.

Es gibt darüber für den Vic20 guten Bücherhinweise als PDF.

Gruss

Was sind das für Bücher?

spacer · 31. Oktober 2019

Das sind VIC20-PDF in der WOLKE .

Gruss

gamersince1984 · 31. Oktober 2019

Ok, vielen Dank.

Acorn · 31. Oktober 2019

Da die Zeichen im Speicher hintereinander liegen, kann man hoch/runter auch mit Selfmod-Code kürzen.

Code

LDA #$00
LDX #$F0
COPY_DOWN LDY CHAR_AB-$F0,X
STA CHAR_AB-$F0,X
TYA
INX
BMI COPY_DOWN
RTS
; -------------------------------
LDA #$00
LDX #$0F
COPY_UP LDY CHAR_AB,X
STA CHAR_AB,X
TYA
DEX
BPL COPY_UP
RTS

Alles anzeigen

JeeK · 31. Oktober 2019

Zitat von aitsch

Hat noch jemand eine gute Idee für hoch/runter ?????

( JeeK : Deinen Vorschlag muss ich am WE noch etwas genauer studieren)

Der selbstmodifizierende Code ist eigentlich auch nicht wirklich meines. Ich hab's versucht in Anlehnung an die Rechts/Links-Bewegung.

Ich selbst würde es eher so machen. Für die Bewegung rauf runter sind die beiden Zeichen übereinander angeordnet, oder?

D.h. du hast die eine Schleife über 7 Schritte gemacht, die in beiden Zeichen gleichzeitig nach oben (bzw. unten) kopiert.

Nur das eine Byte das von einem Block in den nächsten wandert muss gesondert behandelt werden. Ganz unten (oben) kommt eine 0 rein.

(das erklärt auch meine Frage zuvor)

Das PHA/PLA braucht man dann nur, um eben den "Übertrag" von einem Block zum nächsten zu machen.

Der Ansatz ist der, dass man nicht mit 2 ZP-Pointer, sondern mit 4 arbeitet, wobei 2 schon entsprechend versetzt sind.

Da muss man dann nicht mehr mit den Indizes herum tun.

Code

.shift_char2tmp lda #$18 ; High Byte für die Adressen
sta zp+1
sta zp2+1
sta zp3+1
sta zp4+1
ldy character_no
lda lowbyte_tmp,y
sta zp2 ; LowByte für das Ziel
sta zp4 ; LowByte für Ziel um 1 versetzt
inc zp4 ; zp4 = zp2+1
bne .no_overflow_zp4
inc zp4+1
.no_overflow_zp4
lda lowbyte_char,y
sta zp ; LowByte für die Ausgangsposition
sta zp3 ; LowByte für Ausgangspos. um 1 versetzt
inc zp3 ; zp3 = zp+1
bne .no_overflow_zp3
inc zp3+1
.no_overflow_zp3
ldy #7
lda DIR ; Bewegungsrichtung laden
...
.scroll_d
dey ; 6 - y ist eingangs immer auf 7
lda (zp3),y
pha ; unterste Zeile kommt in den nächsten Block
.loop_down lda (zp),y ; von Zeile 6 im Ausgangschar.
sta (zp3),y ; auf Zeile 7 kopieren lda (zp2),y ; von Zeile 6 im Zielchar.
sta (zp4),y ; auf Zeile 7 kopieren
dey
bpl .loop_down
iny ; 0
tya
sta (zp),y ; Zeile 0
pla ; gerettetes Byte aus Ausgangsblock wandert
sta (zp2),y

Alles anzeigen

Schaut auch eleganter aus, ist fast so schnell wie der selbstmodifizierende Code, wobei beim letzteren mehr Initialisierungsarbeit nötig ist (das Patchen an 7 Stellen, wenn man von meinem Vorschlag ausgeht).

Jotta · 1. November 2019

Zitat von aitsch

Danke für die umfangreiche Beschreibung. Allerdings bilde ich keine Sprites nach (2x2 Characters) sondern eine Figur besteht nur aus 1 Character.

Nein, meine Figur hat auch nur 8x8 Pixel. Für das Verschieben

nach Links/Rechts brauchst du nunmal 16x8 Pixel, d.h. wie

bei deinem Ansatz ganz Oben 2 Zeichen. Und da du bei deinem

ersten Programm auch noch Hoch/Runter erwähnt hast, habe

ich daraus 16x16 Pixel, d.h. 2x2 Zeichen für beliebige Richtungen.

(nur für Hoch/Runter brauchst du natürlich auch nur 2 Zeichen)

Und mit

Zitat von aitsch

Hat noch jemand eine gute Idee für hoch/runter ?????

kommst du in etwa auf meinen Ansatz. (ist dein Endgegner

dann z.B. 16x16 Pixel, dann hast du 3x3 Zeichen etc.)

Ob du wie ich Oben beschrieben dann noch den Hintergrund

(der Zeichen z.B.) noch reinkopierst musst du entscheiden,

ich kenne dein Anwendungsszenario nicht.

Code für bitweises Verschieben von Character a -> b optimieren

androSID 30. Oktober 2019

Tags