z80 Assembler Anfaengerfragen

SuperIlu · 3. Oktober 2017

Moins,

ich lerne grade Z80-Assembler am Beispiel eines ROM-Monitors fuer meinen Z80-Selbstbau.
Dabei stosse ich hin&wieder auf Fragen wie man bestimmt Dinge am besten in Z80-Assembler implementiert.
Aktuell: Ich habe eine Kopierfunktion die bekommt drei Adressen uebergeben (Start, Ende und Ziel) und soll jetzt von Start bis Ende laufen.

Wie kann ich am besten das Endekriterium abfragen? Ich habe keine Moeglichkeit gefunden zwei 16-Bit Register mit einander zu vergleichen.
Meine derzeitige Loesung siehtwie unten aus, geht das eleganter?

Code

; ==========
; USAGE: c <SADDR> <EADDR> <DADDR> = copy bytes from SADDR-EADDR to DADDR
; saddr = BC
; eaddr = DE
; daddr = HL
monitor_copy:
ld a,(hl) ; load second char
CP SPACE ; check if SPACE
jp nz,monitor_usage ; nope -> no parameters?
inc hl ; parameter start
call console_gethex16 ; read addr to
jp c,monitor_usage ; conversion error->usage
push bc ; put saddr to stack
ld a,(hl) ; load next char
CP SPACE ; check if SPACE
jr nz,mc.error1 ; nope -> no parameters?
inc hl ; parameter start
call console_gethex16 ; read addr to
jr c,mc.error1 ; conversion error->usage
push bc ; put eaddr to stack
ld a,(hl) ; load next char
CP SPACE ; check if SPACE
jr nz,mc.error2 ; nope -> no parameters?
inc hl ; parameter start
call console_gethex16 ; read addr to
jr c,mc.error2 ; conversion error->usage
ld h,b ; put daddr to HL
ld l,c
pop de ; get other parameters
pop bc
mc.loop:
ld a,b ; compare upper address bytes
cp d
jr nz,mc.cont ; not equal -> continue
ld a,c ; compare lower address bytes
cp e
jr nz,mc.cont ; not equal -> continue
jp monitor ; both equal -> end reached
mc.cont:
ld a,(bc) ; load byte
ld (hl),a ; store at dest
inc bc ; increment pointers
inc hl
jr mc.loop ; next
mc.error2:
pop bc ; pop second parameter
mc.error1:
pop bc ; pop first parameter
jp monitor_usage

Alles anzeigen

oobdoo · 3. Oktober 2017

LDIR und ähnliche Befehle verwenden. Die benötigen in HL, DE und BC ihre Daten und laufen automatisch bis zum Ende durch.
Bei kleinen Schleifen kann man auch DJNZ verwenden.
Schau mal auf der F64 Wolke nach Z80 Literatur. Da sollte genug in Deutsch vorhanden sein.

http://www.cpcwiki.eu/index.php/Z80

SuperIlu · 3. Oktober 2017

ah danke, LDDR und LDIR waren mir bisher entgangen

Literatur habe ich Offline und Online eine Menge, nur DEN passenden Befehl in einer 700-Seiten Referenz finden ist nicht ganz so einfach.
Ausserdem warnt einen so ein Buch auch nicht vor Dummheiten *g*

oobdoo · 3. Oktober 2017

Zitat von SuperIlu

ah danke, LDDR und LDIR waren mir bisher entgangen

Wenn Du vom 6502 kommst... der Z80 kann/macht einiges mehr/anders. Daran muss man sich erstmal dran gewöhnen.

SuperIlu · 3. Oktober 2017

Ich *hust* komme (wenn ueberhaupt) vom m68k. Seit dem habe ich zwar noch bruchstueckhaft SPARC und ARM Assembler gemacht, aber im Grossen und Ganzen nur C und aufwaerts

oobdoo · 3. Oktober 2017

Zitat von SuperIlu

Ich *hust* komme (wenn ueberhaupt) vom m68k. Seit dem habe ich zwar noch bruchstueckhaft SPARC und ARM Assembler gemacht, aber im Grossen und Ganzen nur C und aufwaerts

Da kenn ich ein bisschen den Weg vom Z80 -> 68k und hatte mich damals sehr schwer getan.

daybyter · 3. Oktober 2017

Guck mal nach dem Buch von Rodney Zaks. Da steht eigentlich alles drin, was man wissen muss.

SuperIlu · 3. Oktober 2017

Du meinst das hier?

oobdoo · 3. Oktober 2017

Zitat von SuperIlu

Du meinst das hier?

Jo, das meint er.

In ausländisch fehlt es noch in meiner Sammlung.

daybyter · 3. Oktober 2017

Bei mir ist es schwarz...?

https://www.amazon.de/Programm…Rodnay-Zaks/dp/388745099X

SuperIlu · 3. Oktober 2017

moeglicherweise weil deines germanisch ist und meines angelsaechsisch?

oobdoo · 3. Oktober 2017

Die schwarze Ausgabe ist in der Regel eine Hardcover Version.

JeeK · 3. Oktober 2017

Ich bin jetzt auch nicht gerade ein Hardcore-Z80-Coder und wage nur eher einfache Ratschläge diesbezüglich zu erteilen, aber vielleicht einige Anmerkungen zum Ganzen:

Das Parsing der Argumente: da wiederholt sich die Überprüfung auf BLANK immer wieder. Das würde ich auch in ein Unterprogramm auslagern. Da kann man dann auch in einer Schleife auch mehrere Leerzeichen akzeptieren, was die Syntax etwas entspannt. Einen Fehler kann man ja mit dem Carry retournieren und individuell behandeln.
Beim Kopieren sollte man generell auch eine etwaige Überlappung berücksichtigen und entsprechend "von oben" oder "von unten" kommend übertragen, sonst artet eine solche Aktion in eine mehr oder weniger arge Datenvernichtung aus.

Beim Durchlesen der Frage fiel mir doch noch etwas zu der Endebedingung ein, weil ich das immer wieder gesehen habe bzw. auch für andere CPUs oft gilt: Für solche Schleifen am Besten einen Zähler für die Anzahl der Durchläufe (zu übertragenden Bytes) ermitteln. Denn kann man dann bequem runterzählen und relativ "billig" auf 0 überprüfen (wenn man nicht gerade LDIR und Verwandte verwendet), z.B.

Code

loop:
...
dec bc
ld a,b
or c
jp nz,loop

Es gibt auch noch die Speed-Variante. In BC ist die Anzahl, die für das Herunterzählen so korrigiert wird, dass der Unterlauf auf das High-Byte beim Übergang von 1 auf 0 (statt sonst von 0 auf 255) passiert.

Code

ld a,b
jp z,nocorr ; wenn Low-Byte <> 0
inc c ; High-Byte korrigieren
nocorr:
...
loop:
...
djnz loop ; Low-Byte herunterzählen
dec c ; High-Byte herunterzählen
jp nz,loop

SuperIlu · 4. Oktober 2017

Danke fuer die Anmerkungen.

Zitat von JeeK

Das Parsing der Argumente: da wiederholt sich die Überprüfung auf BLANK immer wieder. Das würde ich auch in ein Unterprogramm auslagern. Da kann man dann auch in einer Schleife auch mehrere Leerzeichen akzeptieren, was die Syntax etwas entspannt. Einen Fehler kann man ja mit dem Carry retournieren und individuell behandeln.

Was wuerde das Unterprogramm im Ablauf verbessern? AFAIK verbraucht der SPACE-check 5-6 Byte, ein einzelnes CALL benoetigt schon 3 Byte, der bedingte Sprung wg. CF dann noch mal 2-3 Byte. Ausser der von Dir angesprochenen Funktionalitaet das ich auch mal mehrere SPACE weg'parsen' kann gewinne ich also nichts.
Da ich auf absehbare Zeit der einzige Anwender fuer den Monitor bin kann ich auf die entspannte Syntax erst mal verzichten. Zumal ich das vermutlich eh sehr schnell mit Python scripten werde

Zitat von JeeK

Beim Kopieren sollte man generell auch eine etwaige Überlappung berücksichtigen und entsprechend "von oben" oder "von unten" kommend übertragen, sonst artet eine solche Aktion in eine mehr oder weniger arge Datenvernichtung aus.

Du hast voellig recht, ich schau mal das ich eine Fallunterscheidung fuer SADDR>DADDR und SADDR<DADDR einbaue. Ich sehe mich naemlich schon Fehler jagen wenn ich das das erste Mal falsch benutze. Da hab ich ein Haendchen fuer

Zitat von JeeK

Beim Durchlesen der Frage fiel mir doch noch etwas zu der Endebedingung ein, weil ich das immer wieder gesehen habe bzw. auch für andere CPUs oft gilt: Für solche Schleifen am Besten einen Zähler für die Anzahl der Durchläufe (zu übertragenden Bytes) ermitteln. Denn kann man dann bequem runterzählen und relativ "billig" auf 0 überprüfen (wenn man nicht gerade LDIR und Verwandte verwendet)

@oobdoo erwaehnte ja schon LDIR und LDDR. Die Kommandozeilensyntax mit SADDR und EADDR habe ich mir bei einem anderen Monitor abgeguckt und finde die recht nett so, deswegen habe ich mich fuer Endadressen statt Groessenangaben entschieden. Sowohl fuer die LDIR/LDDR, als auch fuer Deine Variante muesste ich jetzt die Endadresse erst "umstaendlich" in eine Groesse umrechnen.
Dein Codebeispiel mit dec, ld und or habe ich an anderer Stelle (wo ich mit Groessen arbeite) genau so stehen

JeeK · 4. Oktober 2017

Bitte, ich möchte niemanden überzeugen oder überreden etwas zu verwenden, das ist nur Anregungen. Es is tvöllig freigestellt es zu verwenden oder auch nicht. Außerdem sind diese öffentlich, können und sollen auch von anderen gelesen werden, die vielleicht ähnliche Fragestellungen haben und auf der Suche sind.

Zitat von SuperIlu

Was wuerde das Unterprogramm im Ablauf verbessern? AFAIK verbraucht der SPACE-check 5-6 Byte, ein einzelnes CALL benoetigt schon 3 Byte, der bedingte Sprung wg. CF dann noch mal 2-3 Byte. Ausser der von Dir angesprochenen Funktionalitaet das ich auch mal mehrere SPACE weg'parsen' kann gewinne ich also nichts.
Da ich auf absehbare Zeit der einzige Anwender fuer den Monitor bin kann ich auf die entspannte Syntax erst mal verzichten. Zumal ich das vermutlich eh sehr schnell mit Python scripten werde

Normalerweise geht es bei Monitoren eher sehr beengt von Platzanforderungen her zu (jetzt ungeachtet deiner konkreten Randbedingungen). Da darf ein Hinweis zur Faktorisierung schon gestattet sein. Wenn man vielleicht von mehreren Kommandos ausgehen würde, die alle dieses Parsing betreiben, dann multipliziert sich das entsprechend, selbst wenn nur ein Byte Ersparnis wäre. BTW, das INC HL könnte man auch reinpacken. Wie gesagt, es war eigentlich eine allgemeine Überlegung und keine auskalkulierte Lösung. Ein CALL mit JR braucht fix 5 Bytes im Vergleich zu den 6 (mit dem INC HL), oder? Die Faktorisierung, egal ob mit Unterprogrammen oder auch mit Makros (wenn es die Geschwindigkeit erfordern sollte) hat auch hinsichtlich Fehlerträchtigkeit beim Programmieren selbst seine Vorteile.

Zitat von SuperIlu

@oobdoo erwaehnte ja schon LDIR und LDDR. Die Kommandozeilensyntax mit SADDR und EADDR habe ich mir bei einem anderen Monitor abgeguckt und finde die recht nett so, deswegen habe ich mich fuer Endadressen statt Groessenangaben entschieden. Sowohl fuer die LDIR/LDDR, als auch fuer Deine Variante muesste ich jetzt die Endadresse erst "umstaendlich" in eine Groesse umrechnen.
Dein Codebeispiel mit dec, ld und or habe ich an anderer Stelle (wo ich mit Groessen arbeite) genau so stehen

Klar, @oobdoo hat es ja schon erwähnt. Es war nur eine notwendige Referenz auf seine Erwähnung am Rande. Es lag nicht in meiner Absicht die "Lorbeeren" @oobdoos irgendwie wegzuschnappen. Die Urheberrechte wird er wohl auch nicht auf die Worte einfordern können.
Das ist ja üblich, dass Monitore eine Start- und Endadresse für einen Bereich erwarten. Das schließt ja nicht aus, dass man die Länge berechnen kann. Umständlich? Der Z80 hat doch 16-Bit-Arithmetik, wo das ziemlich unaufwändig geht, oder. Aber selbst beim 6502, wo man das byte-weise machen muss, lohnt sich das. Wenn man wegen der Überlappung herumrechnet, dann braucht man die Länge ohnehin oder ergibt sich nebenbei.
Ich hab ja nicht behauptet die Codebeispiele seien ein Novum, genau das Gegenteil (zumindest die 1. Variante, die 2. Variante hab in freier Wildbahn ehrlich gesagt noch nicht gesehen, wobei mir aber nur sporadisch Z80-Code unterkommt und ich das in Wirklichkeit schlecht beurteilen kann), denn die 1. ist faktisch Standard. Es war ja Eingangs so gefragt, wie man denn das macht, wegen dem Endadressenvergleich - ich wäre fast geneigt zu sagen: gar nicht, wenn es nicht notwendig ist oder mit einem Zähler einfacher oder schneller geht. Aber das können Z80-Gurus vielleicht besser beurteilen. Tut mir leid, das ich mich erdreistet habe, etwas Konkretes anzugeben statt vielleicht noch ein Buch zur Lektüre zu empfehlen...

SuperIlu · 4. Oktober 2017

Zitat von JeeK

Tut mir leid, das ich mich erdreistet habe, etwas Konkretes anzugeben statt vielleicht noch ein Buch zur Lektüre zu empfehlen...

Du hast meine Antwort scheinbar falsch verstanden. Ich wollte nur meine Motivation und die Gruende fuer meine Art der Implementation darlegen und nicht kritisieren das Du Vorschlaege machst oder Alternativen anbietest. Ich bin Dankbar fuer Vorschlaege, ich moechte aber trotzdem darlegen wie und warum ich zu meinen Loesungen gekommen bin. Wenn meine Art der 'Diskussionsfuehrung' aneckt, dann tut mir das leid.

Zitat von JeeK

Das ist ja üblich, dass Monitore eine Start- und Endadresse für einen Bereich erwarten. Das schließt ja nicht aus, dass man die Länge berechnen kann. Umständlich? Der Z80 hat doch 16-Bit-Arithmetik, wo das ziemlich unaufwändig geht, oder.

Genau solche Infos hatte ich mir aus der Diskussion erhofft. Das SBC mit 16-Bit Registern war mir voellig entgangen weil ich in den Referenzen immer nach 'sub' gesucht habe. Mit der Info sieht Dein Vorschlag gleich wieder anders aus.

Zitat von JeeK

[...] SPACE-Parsing [...]

An Macros hab ich auch schon gedacht, 'Optimierungen' vertage ich aber auf 'spaeter' wenn ich die Funktionalitaet mal im Kasten habe. An die Version mit dem INC HL hab ich noch nicht gedacht, da muss ich noch mal genauer nachsehen. Auc hier gilt wieder: Ich hab nur meine Gruende dargelegt warum ich das mit der Unterfunktion nicht gemacht habe. Ich bin beim ersten Nachrechnen drauf gekommen das der Platzgewinn minimal bis nicht vorhanden waere und auch die Anzahl Codezeilen bei der SPACE Erkennung nicht sinkt. Ich wollte nur rausfinden ob Du evtl. noch mehr Potential siehst als ich.

JeeK · 4. Oktober 2017

Zitat von SuperIlu

Du hast meine Antwort scheinbar falsch verstanden. Ich wollte nur meine Motivation und die Gruende fuer meine Art der Implementation darlegen und nicht kritisieren das Du Vorschlaege machst oder Alternativen anbietest. Ich bin Dankbar fuer Vorschlaege, ich moechte aber trotzdem darlegen wie und warum ich zu meinen Loesungen gekommen bin. Wenn meine Art der 'Diskussionsfuehrung' aneckt, dann tut mir das leid.

Offenbar. Kein Problem, ist schon gut so.

Zitat von SuperIlu

Genau solche Infos hatte ich mir aus der Diskussion erhofft. Das SBC mit 16-Bit Registern war mir voellig entgangen weil ich in den Referenzen immer nach 'sub' gesucht habe. Mit der Info sieht Dein Vorschlag gleich wieder anders aus.

Ja, irgendwie witzig, diese an diversen Stellen fehlende Symmetrie im Befehlssatz (was recht symptomatisch bei 8-Bittern zu sein scheint).
ADD HL und ADC HL, dazu aber nur ein SBC HL ... (wenn ich richtig lese).

Zitat von SuperIlu

An Macros hab ich auch schon gedacht, 'Optimierungen' vertage ich aber auf 'spaeter' wenn ich die Funktionalitaet mal im Kasten habe. An die Version mit dem INC HL hab ich noch nicht gedacht, da muss ich noch mal genauer nachsehen. Auc hier gilt wieder: Ich hab nur meine Gruende dargelegt warum ich das mit der Unterfunktion nicht gemacht habe. Ich bin beim ersten Nachrechnen drauf gekommen das der Platzgewinn minimal bis nicht vorhanden waere und auch die Anzahl Codezeilen bei der SPACE Erkennung nicht sinkt. Ich wollte nur rausfinden ob Du evtl. noch mehr Potential siehst als ich.

Naja, Makros schöpfen ihren Sinn eigentlich besonders daraus, wenn man sie beim Entwicklen gleich einsetzt ... wenn man es schon mal hat, dann ist es fast nur noch Kosmetik.
Ja wie gesagt, es gibt ja auch andere Gründe, die ich angeführt habe, die eine Kapselung in Unterprogrammen rechtfertigt - auch ohne Platzgewinn. Schon alleine zur Fehlervermeidung, der Übersichtlichkeit wegen beispielsweise. Wie gesagt, jeder nach seinem Gusto.

SuperIlu · 30. Oktober 2017

ReTach,

nach einigen Ausfluegen in die DOS-Welt und einem kurzen Urlaub hab ich mal wieder Zeit fuer den Z80 gehabt.
Ich habe Eure Anregungen aufgegriffen und umgesetzt und will jetzt mal das Ergebnis praesentieren.

Der Code ist zwar nicht unbedingt kleiner geworden, aber an einigen Stellen doch lesbarer/praegnanter.

Code

; ==========
; USAGE: c <SADDR> <EADDR> <DADDR> = copy bytes from SADDR-EADDR to DADDR
; SADDR = HL
; SIZE = BC
; daddr = DE
monitor_copy:
call monitor_chkspace ; check for SPACE
jp c,monitor_usage
call console_gethex16 ; read addr to
jp c,monitor_usage ; conversion error->usage
push bc ; put saddr to stack
call monitor_chkspace ; check for SPACE
jr c,mc.error1 ; nope -> no parameters?
call console_gethex16 ; read addr to
jr c,mc.error1 ; conversion error->usage
push bc ; put eaddr to stack
call monitor_chkspace ; check for SPACE
jr c,mc.error2 ; nope -> no parameters?
call console_gethex16 ; read addr to
jr c,mc.error2 ; conversion error->usage
ld d,b ; put daddr to DE
ld e,c
pop hl ; get EADDR
pop bc ; get SADDR
push bc
or a ; clear CF
sbc hl,bc ; EADDR-SADDR
ld b,h ; put size to BC
ld c,l
pop hl ; put SADDR to HL
ldir ; copy data
jp monitor ; and exit
mc.error2:
pop bc ; pop second parameter
mc.error1:
pop bc ; pop first parameter
jp monitor_usage
; ==========
; check if current char in (HL) is a SPACE.
; YES
; CF=0
; HL := HL+1
; NO
; CF=1
; return the chart in A
monitor_chkspace:
ld a,(hl) ; load next char
CP SPACE ; check if SPACE
jr nz,mcp.no ; nope
inc hl
scf ; CF=0
ccf
ret
mcp.no:
scf
ret
; ==========
; print memory contents
monitor_print_mem:
call monitor_chkspace ; check for SPACE
jr c,monitor_usage
call console_gethex16 ; read addr to
jr c,monitor_usage ; conversion error->usage
ld d,b ; put addr to DE
ld e,c
call monitor_chkspace ; check for SPACE
jr nc, mpm.read_size ; yep-> try to read size
ld b,8 ; nope->use 8 bytes
jr mpm.print_address
mpm.read_size:
call console_getdez ; read decimal
jr c,monitor_usage ; conversion error->usage
ld b,l ; use lower 8bits of value
mpm.print_address:
ld a,'$' ; print hex marker
call console_putc
ld a,d ; print upper address byte
call console_print_hex
ld a,e ; print lower address byte
call console_print_hex
ld a,':' ; print colon
call console_putc
ld c,9 ; store counter in C
mpm.print_loop:
dec c ; decrement line-counter
jr nz,mpm.next_byte ; not 0 -> print next byte
call console_newline ; print newline
jr mpm.print_address ; and address again
mpm.next_byte:
ld a,' ' ; print SPACE
call console_putc
ld a,(de) ; get byte
inc de ; point to next
call console_print_hex ; print HEX
djnz mpm.print_loop ; decrement counter
call console_newline
jp monitor

Alles anzeigen

Danke nochmal
Ilu

JeeK · 30. Oktober 2017

Schaut sehr gefällig aus. Prächtig.
Aber eventuell noch folgende Korrektur:
Wenn EADDR mitkopiert werden soll, muss man EADDR-SADDR+1 als Anzahl der zu übertragenden Bytes für BC setzen. Also nach dem SBC ein INC BC ergänzen.

utz · 30. Oktober 2017

Zitat von JeeK

Code

ld a,b

jp z,nocorr ; wenn Low-Byte <> 0

inc c ; High-Byte korrigieren

nocorr:

...

loop:

...

djnz loop ; Low-Byte herunterzählen

dec c ; High-Byte herunterzählen

jp nz,loop

Da fehlt ein "or a" nach dem "ld a,b" in Zeile 1 LoaD-Befehle setzen auf dem Z80 keine Flags, mit Ausnahme von "ld a,i" und "ld a,r".