Real-Zahlen und Funktionen im cc65 nutzen...zur Umsetzung

daybyter · 8. November 2011

Hallo!

Zitat von polluks

xfMax = fsqr( _fsub( _fmul( yfMin, yfMin), _fmul( yf, yf)));

Ich bin verblüfft...ich hab die Zeile jetzt minimal geändert:

Code

xfMax = _ftoi( _fadd( _strtof( "0.5"), fsqr( _fsub( _fmul( yfMin, yfMin), _fmul( yf, yf)))));

, weil man doch eine Integer will. Also Deinen Ausdruck einfach gerundet, und er liefert immer 0. Läuft Deine Schleife jetzt mit floats?

Ich bin jetzt dran, und versuch mal Teile von SoftFloat ans Laufen zu bekommen. Das sind single precision floats mit 32 bit. Wenn man es hinbekäme, dass man 2 Zahlen in den beiden long Akkus des cc65 addiert, _ohne_ dass man sie jn den Funktionen überschreibt, müsste der Einbau eigentlich machbar sein. Aber da muss ich noch ein bischen probieren.

Ciao,
Andreas

daybyter · 8. November 2011

Hab jetzt mal als Ablenkung von den Floats ne Routine für verkale Linien angefangen. Ist noch ein Bug drin, aber die Idee ist hoffentlich erkennbar. Nach dem Setzen eines Bit soll die nächste, zu setzende, Adresse durch eine einfache Addition gefunden werden. Ich hoffe mal, in dieser Richtung noch ne Ecke Zeit sparen zu können...

Code

void c64_vertiLine( int x, unsigned char y, unsigned char y2) {
unsigned char *byteAddr;
unsigned int lineOffset;
unsigned char bitmask = (unsigned char)0x7f >> (x & 7);
if( y2 < y) {
char swap = y;
y = y2;
y2 = swap;
}
/* Start of a 1-Byte line is
(y / 8) * 320
= (y & ~7) * 40
= (y & ~7) * 8 + (y & ~7) * 32
*/
lineOffset = y & 0xf8;
lineOffset <<= 3;
byteAddr = (unsigned char *)lineOffset;
byteAddr += (lineOffset << 2);
/* Column is (x / 8) * 8 = x & ~7 */
byteAddr += (x & 0xfff8);
/* Byte is y & 7 */
byteAddr += ( y & 7);
/* Add the base address of the video memory. */
byteAddr += 0xe000;
while( y <= y2) {
*byteAddr &= bitmask;
byteAddr += (++y & 7) == 0 ? 313 : 1;
}
}

Alles anzeigen

Ciao,
Andreas

BlackJack · 9. November 2011

daybyter: Mit ``&`` löschst Du doch Bits und die Bitmaske sieht mir auch falsch aus, denn die ist nur dann 1 Pixel breit wenn der Ausdruck rechts vom ``>>`` 0 ergibt. Von links werden ja 0en "reingeschoben".

daybyter · 9. November 2011

Hallo!

Danke für Deinen Kommentar. Also es soll ja eine weisse Linie gezeichnet werden. Die Bits sollen also gelöscht werden. Insofern denke ich, dass das & schon richtig ist. Mit der Bitmaske hast Du völlig recht. Ich hab das jetzt mal auf

unsigned char bitmask = ~( (unsigned char)0x80 >> (x & 7));

geändert, so dass alle Bits, bis auf das bei (x mod 8 ) 1 sein sollten. Das muss doch 0 sein, damit es dann bei dem & gelöscht wird. Klappt aber immer noch nicht. Ich glaub, ich hab da auch einen Offset zu der Bildschirmspeicher-Adresse drin. Dann bin ich noch unsicher, ob die Schleife mit dem Mitführen von y so geschickt ist. Schöner wäre es eigentlich, wenn man gleich zu Anfang die letzte zu ändernde Adresse berechnet, und dann in der Schleife nur noch an die Adresse schreibt, sie erhöht und dann vergleicht, ob man schon die Endadresse erreicht hat. Ich bin mir da nur unsicher, weil es ja für einen 8-Bit-Prozessor ist, und der y-Vergleich in einem Byte zu machen ist. Der Adress-Pointer sind ja 2 Byte, die man vergleichen muss, was ja für nen 6510 mehr Aufwand ist.

Ciao,
Andreas

daybyter · 9. November 2011

Ich bin so langsam am grübeln, ob der cc65 falschen Code erzeugt?

Code

*byteAddr &= bitmask;

ist mein einziger Schreibbefehl, d.h. es dürften auf keinen Fall neue Bits gesetzt werden. Trotzdem passiert das...?

Das macht der Compiler draus:

Code

00019Er 1 ;
00019Er 1 ; *byteAddr &= bitmask;
00019Er 1 ;
00019Er 1 A0 04 ldy #$04
0001A0r 1 20 rr rr jsr ldaxysp
0001A3r 1 20 rr rr jsr pushax
0001A6r 1 A0 00 ldy #$00
0001A8r 1 20 rr rr jsr ldauidx
0001ABr 1 20 rr rr jsr pushax
0001AEr 1 A0 04 ldy #$04
0001B0r 1 A2 00 ldx #$00
0001B2r 1 B1 rr lda (sp),y
0001B4r 1 20 rr rr jsr tosandax
0001B7r 1 A0 00 ldy #$00
0001B9r 1 20 rr rr jsr staspidx

Alles anzeigen

Werden hier evtl. 16 bit, statt 8 geschrieben? Sind mir eigentlich nicht danach aus...*grübel*

Ciao,
Andreas

BlackJack · 9. November 2011

daybyter: Ich ging davon aus, dass eine Linien-Zeichnen-Routine Bits setzt und man das mit den Farben über das Video-RAM und nicht über das Bitmuster löst.

Bezüglich `y` oder Endadresse berechnen müsstest Du halt einfach schauen was der Compiler an Code generiert. Und vielleicht noch mit der „static locals“-Einstellung und dem ``register``-Schlüsselwort experimentieren. Wobei es da dann eventuell auch einfacher sein kann es gleich in Assembler zu implementieren.

daybyter · 9. November 2011

Diese Linienfunktion soll ja quasi den Hintergrund auslöschen, und schreibt daher in der Hintergrund-Farbe. Evtl. fass ich die plot und Line-Routine noch zusammen, damit die Adresse nur einmal berechnet werden muss. Würde nochmal bischen Zeit sparen.

Den Code hab ich mir ja schon angesehen, steig aber noch nicht wirklich durch, weil halt soviele Unterroutinen aufgerufen werden, deren Code ich teilweise auch noch nicht ergoogeln konnte. Und auch ohne register-Schlüsselwort müsste der Code doch korrekt funktionieren, auch wenn er vielleicht langsamer ist?

Muss ich nochmal suchen und evtl. paar Testpogramme schreiben.

Ciao,
Andreas

BlackJack · 9. November 2011

daybyter: Öhm, Du machst Dir ständig Gedanken was wohl für den 6510 zu schnellerem Code übersetzt wird, lässt den Compiler aber anscheinend nichts optimieren!? So sieht das mit Optimierungen aus:

Code

00007Er 1 ;
00007Er 1 ; *byteAddr &= bitmask;
00007Er 1 ;
00007Er 1 88 L001C: dey
00007Fr 1 B1 rr lda (sp),y
000081r 1 AA tax
000082r 1 88 dey
000083r 1 B1 rr lda (sp),y
000085r 1 85 rr sta sreg
000087r 1 86 rr stx sreg+1
000089r 1 85 rr sta ptr1
00008Br 1 86 rr stx ptr1+1
00008Dr 1 A0 00 ldy #$00
00008Fr 1 B1 rr lda (ptr1),y
000091r 1 85 rr sta ptr1
000093r 1 A2 00 ldx #$00
000095r 1 B1 rr lda (sp),y
000097r 1 25 rr and ptr1
000099r 1 91 rr sta (sreg),y

Alles anzeigen

Und so wenn man dem Compiler sagt er soll lokale Variablen statisch machen:

Code

000097r 1 ;
000097r 1 ; *byteAddr &= bitmask;
000097r 1 ;
000097r 1 AD rr rr L0020: lda L0002
00009Ar 1 AE rr rr ldx L0002+1
00009Dr 1 85 rr sta sreg
00009Fr 1 86 rr stx sreg+1
0000A1r 1 85 rr sta ptr1
0000A3r 1 86 rr stx ptr1+1
0000A5r 1 B1 rr lda (ptr1),y
0000A7r 1 85 rr sta ptr1
0000A9r 1 A2 00 ldx #$00
0000ABr 1 AD rr rr lda L0004
0000AEr 1 25 rr and ptr1
0000B0r 1 91 rr sta (sreg),y

Alles anzeigen

Dann ist die Funktion nicht „reentrant“, aber man hat für die lokalen Variablen (nicht die Argumente!) die Indirektion über den Softwarestack nicht mehr. (Man sieht das der Optimierer trotzdem noch Code erzeugt für den man einen menschlichen Programmierer hauen würde. :-))

Beim optimierten Code musst Du auch nicht mehr so viele Unterroutinen nachschlagen. Die würde ich nicht bei Google suchen, sondern in den Quelltexten vom cc65.

BlackJack · 9. November 2011

Wenn man `byteAddr` und `bitmask` als ``register`` deklariert:

Code

000098r 1 ;
000098r 1 ; *byteAddr &= bitmask;
000098r 1 ;
000098r 1 A0 00 L001C: ldy #$00
00009Ar 1 B1 rr lda (regbank+4),y
00009Cr 1 85 rr sta ptr1
00009Er 1 A2 00 ldx #$00
0000A0r 1 A5 rr lda regbank+3
0000A2r 1 25 rr and ptr1
0000A4r 1 91 rr sta (regbank+4),y

Allderdings ist `register` kein Allheilmittel. Es stehen nicht unbegrenzt "Register" in der Zeropage zur Verfügung und es gibt den Mehraufwand die alten "Register"-Inhalte am Anfang der Funktion auf den Softwarestack zu sichern und am Ende der Funktion wieder herzustellen. Man sollte also nicht blindlings alles als ``register`` deklarieren, sondern auch darauf achten ob man dadurch wirklich etwas gewinnt und mit welchen Variablen der Gewinn am grössten ist.

daybyter · 9. November 2011

Danke für den Tipp mit dem Optimieren! Da wird es schon ein ganzes Stück schneller. Funktionieren tut es dummerweise immer noch nicht. Ich schreib mal paar Testfunktionen...

Ciao und Danke nochmal,
Andreas

Edit: das sta (regbank+4),y ist ja anscheinend das Speichern in den Bildschirmspeicher. Was 1 Byte wäre. Wo werden nur die schwarzen Pixel geschrieben? Ich versuch mal direkt in den Speicher zu schreiben, was dann passiert...

Edit2: Interessant...mit folgender Schleife bekomm ich schon Müll in den Bildschirmspeicher geschrieben...das kann doch nur ein Compilterfehler sein, oder?

Code

/* Test screen writing. */
for( screenPtr = (unsigned char *)0xe000; screenPtr < (unsigned char *)0xe100; screenPtr++) {
*screenPtr &= ((unsigned char)0x01);
}

peiselulli · 9. November 2011

Code

(unsigned char *)0xe000

Ist das Kernal-ROM abgeschaltet (ich habe jetzt keine Lust, den ganzen Thread zu durchforsten) ? Ansonsten kopierst Du den Kernal-Code in deine Grafik ...

daybyter · 9. November 2011

Keine Ahnung...das müsste ja theoretisch der TGI-Treiber machen...was er vermutlich nicht macht...und das wäre dann der Fehler....ich glaube, Du hast das Problem gelöst...Danke!!!

ThomBraxton · 21. Juni 2013

daybyter:

Der Code für ein wenig Grafik, den muss ich erst einmal verdauen. Ist ja auch nicht wirklich einfach zu verstehen. Aber das wird bei mir schon....

Gruß!
ThomBraxton

daybyter · 21. Juni 2013

Das sieht nur so verwirrend aus, weil halt die float-Operationen im cc65 fehlen. Deshalb diese fmul, fdiv usw. Methoden. Mit * / usw würde das viel einfacher aussehen...

ThomBraxton · 21. Juni 2013

Du hast soooo viel drauf in C! Kannst Du den Workshop nicht weiter führen? Dich als Lehrer, das wäre echt super!

Gruß!
ThomBraxton

daybyter · 22. Juni 2013

Es ist wirklich viele Jahre her, dass ich ernsthaft C programmiert hab. Ich hab mich die letzten 10 Jahre fast nur um das Design von größeren Applikationen gekümmert und den ganzen Optimierungskram vergessen. Ausserdem bin ich eh ein furchtbarer Lehrer, weil ich nix erklären kann.

ThomBraxton · 29. Juli 2014

Es kommt immer auf einen Versuch an...

Gruß!
Thom