Neuer Retro-Computer im 8-Bit Style

Guido64 · 6. April 2019

Zitat von flowerking

Das wäre vielleicht auch eine Idee für eine virtuelle CPU: eine 6502-ähnliche CPU, nur mit 24-Bit Adressbus. Überall wo die 6502 CPU 2 Bytes für die Adressierung benutzt, benutzt diese CPU 3 Bytes.Also:
LDA $ABCDEF statt LDA $ABCD

Schade wäre dann:

- kein irgendwo geschriebenes Progrann würde auf diesem Prozessor funktionieren weil alle 6502 basierenden Assembler auf maximal 2 Byte Adressierung laufen.

- aus dem oben genannten Grund hast Du nichtmal einen Assembler um selbst Programme zu erstellen.

flowerking · 6. April 2019

Zitat von Freddy

Erstmal 20bit aka 1MB dürfte wohl etwas einfacher sein.

Warum vier Bit verschwenden? Man kann sowieso nur ganze Bytes aus dem Speicher holen.

Zitat von Guido64

- kein irgendwo geschriebenes Progrann würde auf diesem Prozessor funktionieren weil alle 6502 basierenden Assembler auf maximal 2 Byte Adressierung laufen.

- aus dem oben genannten Grund hast Du nichtmal einen Assembler um selbst Programme zu erstellen.

Das stimmt. Richtig kompatibel zum 6502 wäre dieser Prozessor nicht. Da aber die Struktur beider Prozessoren übereinstimmt, wäre es vielleicht möglich, einen vorhandenen Assembler anzupassen. Ich denke mal, dass das weniger Aufwand wäre, als einen Assembler komplett neu zu schreiben.
Aber das Ganze war mehr eine fixe Idee und nicht weiter durchdacht.

alx · 6. April 2019

Zitat von M. J.

Grundsätzlich stimme ich diesem Ansatz voll zu , habe jedoch Bedenken bei der Umsetzung im Befehlssatz. Wie bereits erwähnt kommen negative Offsets so gut wie nie vor, wohingegen man positive Offsets (z. B. für lokale Variablen auf dem Stack oder Objektattribute) häufig benötigt.

Ich hatte auch darüber nachgedacht alle Offsets nur positiv zu machen ausser lea (denn sonst könnte man x,y,s,pc nicht reduzieren)

Aber eines meiner hauptziele ist es eine CPU zu erdenken die auch damals™ jemand hätte bauen können. Wenn man z.B. einen 6502 baut der die zeropage direkt in der cpu speichert würden all die operationen VIEL schneller gehen, aber niemand hätte so etwas baue können/wollen. Darum halte ich die Befehle und Adressierungs-Modi möglichst einfach und einfach zum dekodieren.

Zitat von M. J.

[...], die häufiger gebraucht werden, z. B. "INX". Ein "LEAX X, 1" dürfte mit seinen 3 Speicherzugriffen für eine Zählschleife zu viele Takte verbrauchen, zumal unklar ist, ob bei diesem Befehl die Flaggen gesetzt werden. Sollte dies (wie beim 68000) nicht der Fall sein, so müßte anschließend noch ein Test auf 0 erfolgen.

Na leax x,1 sind nur 2 bytes (opcode + 7bit offset) und nicht 3. Aber wenn du was kopierst machst du eh' "lda x+; sta y+", zum zählen kannst du perfekt b nutzen. Und was die flags betrifft würde ich die sehr ähnlich zum 6502 machen: bei rechen- und ladeoperationen. (aber nicht speichern, jmp und so) (der 6809 z.B. setzt die immer wenn ein register ausser PC betroffen ist, also auch beim sta; die AVR's ändern die flags beim laden/speichern nicht)

M. J. · 6. April 2019

Zitat von alx

Darum halte ich die Befehle und Adressierungs-Modi möglichst einfach und einfach zum dekodieren.

Bist Du Dir sicher, daß das Setzen der oberen Bits auf das Vorzeichenbit des Quelloperanden einfacher ist als das Setzen der oberen Bits auf 0?

Zitat von alx

leax x,1

Sorry, habe den Befehlssatz noch nicht verinnerlicht. Zwei Bytes halte ich trotzdem immer noch für viel. Schnelles In- und Dekrementieren wäre halt mein persönlicher Wunsch. Nebenbei: Gibt es eine Möglichkeit die Befehle "leax x, 1" mit 8 Bit Ergänzung und "leax x, 1" mit 16 Bit-Ergänzung syntaktisch zu unterscheiden? Ansonsten könnte es beim Assemblieren (mit einem 2-Pass-Assembler) u. U. Probleme geben, wenn eine Konstante nicht vorab definiert wurde, so daß sich der Assembler im ersten Pass in der Befehlsbreite verschätzt und infolgedessen falsche Adressen berechnet.

Zitat von alx

zum zählen kannst du perfekt b nutzen

b ist doch nur 8 Bit? Abgesehen davon sind Kopieroperationen nur ein eher seltener Sonderfall und für größere Programme nicht wirklich aussagekräftig.

Verzeih bitte die Frage, aber hattest Du den Befehlssatz bereits in einem Emulator ausprobiert?

Zitat von flowerking

Das wäre vielleicht auch eine Idee für eine virtuelle CPU: eine 6502-ähnliche CPU, nur mit 24-Bit Adressbus. Überall wo die 6502 CPU 2 Bytes für die Adressierung benutzt, benutzt diese CPU 3 Bytes.

Das könnte natürlich gehen, schließlich verfügt der 65816 über genau diese Möglichkeit. Knifflig wird es beim Programmzähler. Entweder gestaltet man diesen ebenfalls 24 Bit breit, was z. B. dazu führt, daß die Rücksprungadresse auf dem Stack länger wird, was Zeit kostet. Oder man verwendet sowas wie NEAR- und FAR-Calls (wie beim 65816), was andere Programmierschwierigkeiten mit sich bringt. Auf jeden Fall dürften Programme mit dem 3-Byte-Schema ein wenig länger und langsamer werden, doch um wieviel ist schwer zu sagen.

Zitat von Guido64

aus dem oben genannten Grund hast Du nichtmal einen Assembler um selbst Programme zu erstellen

Generell gilt für alle Entwürfe eines neuen Rechners, daß das Schreiben eines kleinen Assemblers/Disassemblers und Emulators auf heutigen PCs mit einer Hochsprache wie C oder Java oder ... kein echtes Problem mehr darstellt. Sowas schreibt man an ein oder zwei freien Wochenenden. Für den Anfang würde auch ein befehlsgenauer Emulator ausreichen und eine Videoemulation, die nur jeweils ein ganzes Bild berechnet (also ohne Rasterinterrupts). Das ganze Emulatorsystem kann auch ruhig in sich langsam sein. Das interessiert auf heutigen PCs ohnehin nicht mehr. Eine simulierte Geschwindigkeit von 1 Mhz ist auf jeden Fall machbar, was für reale Programme schon ausreicht. Der einzig wichtige Punkt ist, daß jemand wie alx sich mal traut zu sagen "Hey Leute, ich habe hier einen Befehlssatz. Der sieht so und so aus. Was meint Ihr dazu? Sollte man das nicht mal austesten?" Und dann kann man loslegen. Und wenn man später feststellt, daß die Definition irgendwo Schwachpunkte hat und es anders irgendwie besser ginge, dann hat man was dazugelernt und macht es halt anders.
Kurz gesagt: Es gibt nichts, was einen (bzw. eine Gruppe von Interessierten) davon abhalten würde, sowas zu tun. Macht doch mal einfach.

Vernunftmensch · 6. April 2019

Ein Tastaturcomputer wäre nicht schlecht als neuer Retrocomputer 8bit.
Und das perfekte Aussehen stelle ich mir so vor:
Also in etwa wie die C64 Tastatur drinnen, nur mit Umlauten und ß. Und Cursortasten in alle Richtungen fänd ich gut.

Brotbox64 · 6. April 2019

Oder einen „brotkasten“

atomcode · 6. April 2019

Zitat von Vernunftmensch

Und Cursortasten in alle Richtungen fänd ich gut.

Ja, aber bitte wie beim PC und nicht so ein Tasten-Pad wie bei den MSX-Modellen (und manchen anderen) und auch nicht wie beim Atari 800XL irgendwo mittendrin.

sparhawk · 8. April 2019

Zitat von M. J.

Wie bereits erwähnt kommen negative Offsets so gut wie nie vor,

Negative Offsets sind Standard für Stackvariablen.

Zitat

Daher befürchte ich, daß die Option auf negative Zahlenwerte letztendlich eine Verschwendung darstellt. Desweiteren dürfte die doppelte Indirektion kaum Verwendung finden.

Wie rechnet man dann? Ohne negative Zahlen würde das schwierig werden.

Zitat

Die Benutzung von Zeigern auf Zeigern (, wobei letztere umständlich im Speicher liegen,) ist hingegen in der Praxis kaum erforderlich und auch sehr langsam.

Der Gebrauch von Sprungtabellen ist durchaus üblich. Mit Zeigern kann man Programme deutlich beschleunigen.

Zitat von M. J.

Das könnte natürlich gehen, schließlich verfügt der 65816 über genau diese Möglichkeit. Knifflig wird es beim Programmzähler. Entweder gestaltet man diesen ebenfalls 24 Bit breit, was z. B. dazu führt, daß die Rücksprungadresse auf dem Stack länger wird, was Zeit kostet.

Wenn der Rechner 3 Bytes (oder mehr) für Adressen zur Verfügung hat, dann müssten die Register ebenfalls breiter sein. Wenn man einen Zeiger berechnen will und man hat nur 8-Bit register, dann dürfte das schon ein wenig kompliziert werden. Dann hätte man ein High-, Low- und Middlebyte... Jedes Incrementieren eines Zeigers müsste dann die Adresse über drei Register schieben.

M. J. · 8. April 2019

Zitat von sparhawk

Negative Offsets sind Standard für Stackvariablen.

Nein, es gibt zwei Verfahren, Stackvariablen zu handhaben:
1.) Der aktuelle Stackpointer wird in ein gesondertes Register kopiert (z. B. BP bzw. EBP beim x86). Daraufhin wird der Stackpointer verringert, um Platz zu schaffen auf dem Stack. Nachfolgend werden die Variablen angesprochen über das Spezialregister und einem negativen Offset (z. B. [EBP - 4]). Am Ende des Unterprogramms wird der Inhalt des Spezialregisters in den Stackpointer kopiert. Damit wird der Speicherbereich auf dem Stack wieder freigegeben.
2.) Der aktuelle Stackpointer wird verringert, um Platz zu schaffen auf dem Stack. Nachfolgend werden die Variablen angesprochen über den Stapelzeiger und einem positiven Offset (z. B. [ESP + 4]). Am Ende des Unterprogramms wird der Stackpointer erhöht, um den Speicherbereich auf dem Stack wieder freizugeben.

Voraussetzung für die 1. Methode ist das Vorhandensein eines zusätzlichen Adreßregisters, um den Zeiger auf die lokalen Variablen aufzunehmen. Beim x86 war hierfür das Register BP (Base pointer) vorgesehen. Eine Compileroption beim gcc sorgt jedoch dafür, daß die 2. Methode angewendet wird, was das Register EBP frei läßt für andere Aufgaben. Beim 68000 gibt es den Befehl "LINK #<negativer Offset>, Ax", welcher die erste Methode ausführt. Dies ist möglich, weil der 68000 neben dem Stackzeiger über weitere 7 Adreßregister verfügt.
Der von alx vorgeschlagene Prozessor besitzt jedoch nur 2 Adreßregister X und Y. Es wäre sehr ungünstig, eines von diesen als Adreßzeiger für lokale Variablen zu verwenden. Hier bietet sich vielmehr die zweite Methode an, d. h. lokale Variablen werden angesprochen über S und einem positiven Offset. Oder anders ausgedrückt: Für diesen Prozessortyp macht die erste Methode mit negativen Offsets keinen Sinn.

Zitat von sparhawk

Wie rechnet man dann? Ohne negative Zahlen würde das schwierig werden.

Es ging um negative Adress-Offsets, nicht um negative Konstanten.

Zitat von sparhawk

Der Gebrauch von Sprungtabellen ist durchaus üblich. Mit Zeigern kann man Programme deutlich beschleunigen

Weder Sprungtabellen noch Zeiger waren gemeint, sondern Zeiger auf Zeiger. Diese Adressierungsart ist in Prozessorbefehlssätzen nicht üblich. Weder 6502 noch Z80, 68000, x86, ARM... beherrschen dies aus oben genannten Grund.

Zitat von sparhawk

Jedes Incrementieren eines Zeigers müsste dann die Adresse über drei Register schieben.

So kompliziert wäre das nicht, nur ein wenig länger:

Code

inc zp
bne label
inc zp + 1
bne label
inc zp + 2
label:

Und abwegig ist es auch nicht. Der 65816 arbeitet mit 24 Bits, aber hat die unschöne Eigenschaft, den Speicherbereich in 64kb-Banks zu teilen, so daß man für Sprünge von Bank zu Bank gesonderte Befehle braucht und eine Unterscheidung in NEAR und FAR-Calls.

sparhawk · 8. April 2019

Zitat von M. J.

Nein, es gibt zwei Verfahren, Stackvariablen zu handhaben:1.) Der aktuelle Stackpointer wird in ein gesondertes Register kopiert (z. B. BP bzw. EBP beim x86). Daraufhin wird der Stackpointer verringert, um Platz zu schaffen auf dem Stack. Nachfolgend werden die Variablen angesprochen über das Spezialregister und einem negativen Offset (z. B. [EBP - 4]). Am Ende des Unterprogramms wird der Inhalt des Spezialregisters in den Stackpointer kopiert. Damit wird der Speicherbereich auf dem Stack wieder freigegeben.

Das gilt für lokale Variablen. Üblicherweise werden locale Variablen über EBP mit positivem Offset referenziert, während Funkitionsparameter über ESP mit negativen Offset referenziert werden. Auf 64 Bit System, werden die ersten via Parameter per Register übergeben. Alles was darüber geht ist dann am Stack. Bei 32Bit wird nur der Stack benutzt. Wobei es aber u.A. auch die fastcall Konvention gibt, bei der dann auch Register benutzt werden, aber das ist dann extra anzugeben.

Zitat

Und abwegig ist es auch nicht. Der 65816 arbeitet mit 24 Bits, aber hat die unschöne Eigenschaft, den Speicherbereich in 64kb-Banks zu teilen, so daß man für Sprünge von Bank zu Bank gesonderte Befehle braucht und eine Unterscheidung in NEAR und FAR-Calls.

Kompliziert ist das nicht, aber hässlich. Die Alternative wäre dass man ein Segmentregister benutzen könnte/müsste (wie beim x86 früher). Auch nicht sonderlich schön.

Was passiert eigentlich mit den "überzähligen" Adress Bits. Ist dann 0x00ffffff die gleiche Adresse wie 0x80ffffff weil die obersten Bits ignoriert werden, oder gibts einen Adressfault?

M. J. · 8. April 2019

Zitat von sparhawk

Segmentregister

( )

Zitat von sparhawk

Was passiert eigentlich mit den "überzähligen" Adress Bits. Ist dann 0x00ffffff die gleiche Adresse wie 0x80ffffff weil die obersten Bits ignoriert werden, oder gibts einen Adressfault?

Welchen Prozessor meinst Du? Den 65816? Der hat nur 24 Adreßleitungen und daher gar keine andere Wahl, als alles darüber zu ignorieren. Adressfaults sind bei einem 8-Bit-Prozessor für gewöhnlich auch nicht anzutreffen. Dafür ist der Adreßraum viel zu klein, und wenn dann ein Programm ins Nirvana schreibt, interessiert es auch niemanden.

alx · 9. April 2019

Zitat von M. J.

Es ging um negative Adress-Offsets, nicht um negative Konstanten.

Das ist z.T. das selbe: wenn du nicht "leas s, -5" schreiben kannst weil es keine negativen offsets gibt, wie willst du dann 5 bytes auf den stack pointer reservieren? (Oder X/Y decrementieren)?

Jhonny_Noname · 9. April 2019

ngative Offsets:
ich denke mal, dass das rein Betriebssystemabhängig ist

M. J. · 9. April 2019

Zitat von alx

Das ist z.T. das selbe: wenn du nicht "leas s, -5" schreiben kannst weil es keine negativen offsets gibt, wie willst du dann 5 bytes auf den stack pointer reservieren? (Oder X/Y decrementieren)?

Entweder man unterscheidet zwischen LEA und den anderen Befehlen (nur bei LEA ist der Wert negativ), oder man benutzt für Operationen am Stapelzeiger bzw. fürs In-/Dekrementieren der Register eigene Befehle, oder man benötigt fürs Subtrahieren halt einen 3-Byte-Befehl.
Was mir noch auf-/eingefallen ist:
In der von Dir verlinkten Befehlsübersicht gibt es noch weiße Stellen (z. B. 05 und 08). Hast Du schon Ideen für Befehle, die man an den freien Stellen einbinden könnte?
Welche Flaggen gibt es bei dem Prozessor und wann werden sie gesetzt?
Hattest Du schon mal den Befehlssatz ausgetestet bzw. hast Du vor, Programme mit Hilfe eines Emulators zum Laufen zu bringen? (Leider habe ich wegen anderer Projekte keine Zeit, sonst würde ich mal sowas wie einen kleinen Emulator schreiben.)
Nebenbei: Im Grunde genommen ist der von Dir angestrebte Prozessor eine Mischung aus 8 Bit-Rechner und 16 Bit-Rechner, erinnert daher eher an den Z80 als an den 6502. Besteht bei dem Design nicht eventuell die "Gefahr", daß die 16 Bit-Register für viele Operationen als 16 Bit-Akkumulator gebraucht würden? Wie sollen sich 16 Bit-Operationen unterscheiden von 8 Bit-Operationen? Wäre das nur eine verzögerte Ausführung (z. B. 1 Takt mehr) oder gäbe es irgendwelche Einschränkungen?

Zitat von Jhonny_Noname

ich denke mal, dass das rein Betriebssystemabhängig ist

Nein.

alx · 10. April 2019

Zitat von M. J.

Entweder man unterscheidet zwischen LEA und den anderen Befehlen (nur bei LEA ist der Wert negativ), oder man benutzt für Operationen am Stapelzeiger bzw. fürs In-/Dekrementieren der Register eigene Befehle, oder man benötigt fürs Subtrahieren halt einen 3-Byte-Befehl.Was mir noch auf-/eingefallen ist:
In der von Dir verlinkten Befehlsübersicht gibt es noch weiße Stellen (z. B. 05 und 08). Hast Du schon Ideen für Befehle, die man an den freien Stellen einbinden könnte?

Wie schon gesagt, versuche die die cpu einfach zu halten, also auch das decoding welche operation mit welchem modus ausgeführt werden soll die Anzahl an Operation und so weiter - darum will ich nicht alles bis zum letzten belegen.

Zitat von M. J.

Welche Flaggen gibt es bei dem Prozessor und wann werden sie gesetzt?

Wie die 8 bit avr, ohne dem H flag. Wie carry genutzt wird auch wie die. Gesetzt eher wie beim 6502.

Zitat von M. J.

Hattest Du schon mal den Befehlssatz ausgetestet bzw. hast Du vor, Programme mit Hilfe eines Emulators zum Laufen zu bringen? (Leider habe ich wegen anderer Projekte keine Zeit, sonst würde ich mal sowas wie einen kleinen Emulator schreiben.)

Nein, es ist bis jetzt nur ein Gedankenspiel. Und wenn dann würde ich versuchen den vice oder einen anderen C64 emulator auf die cpu umzubauen.

Zitat von M. J.

Wie sollen sich 16 Bit-Operationen unterscheiden von 8 Bit-Operationen?

Es gibt keine 16 Bit-Operationen ausser lea (und incx = leax x,1).

Ich habe die cpu geändert, nun sind alle (16bit register , 8bit register) operationen in einem opcode versteckt, denn ja, es braucht nicht so viele. Zudem gibt es ein neues Register U, welches aber nur eingeschränkt genutzt werden kann.

Neue Beschreibung

M. J. · 11. April 2019

Zitat von alx

Ich habe die cpu geändert

Danke für die neue Version. Ich finde es immer sehr lehrreich und inspirierend zu sehen, welche Gedanken Andere so verfolgen (z. B. bei Dir die saubere Strukturierung der Befehle) und zu welchen Schlüssen sie gekommen sind.

Zitat von alx

Nein, es ist bis jetzt nur ein Gedankenspiel. Und wenn dann würde ich versuchen den vice oder einen anderen C64 emulator auf die cpu umzubauen.

Dann weiterhin gutes Gelingen, und sollte die Idee voranschreiten, meld Dich bitte wieder.

ogd · 17. April 2019

Zitat von Markaine

[*]1 MB Arbeitsspeicher und kein MB mehr, auch nicht erweiterbar!
...
[*]2 MB (erweiterbar bis 14 MB) die auschließlich als RAM-Disk genutzt werden können

Welchen Zweck hätte so eine Limitierung? Oder anders gefragt: Inwiefern würde ein so beschränkter Adressraum die Kreativität fördern?

Markaine · 17. April 2019

Ein begrenzter Speicher ist eine Limitierung der bei Grafik, Musik/SFX und Programmdaten berücksichtigt werden muss. Man denke nur an die 64 KB RAM des C64 und was es allen Beteiligten die an einem größeren Projekt arbeiten (Demo oder Spiel ist dabei unberheblich) abverlangt. Beispiele dafür ist das Remake von Bomb Jack oder der neuen Version von Giana Sisters die am entstehen sind. Es verlangt von Grafiker(n), Musiker(n) und Programmierer(n) gleichermaßen Kompromisse und Lösungen (z. B. Grafikdaten im Speicher packen/depacken) um das bestmögliche Ergebnis zu erzielen.

Snoopy · 17. April 2019

Zitat von Markaine

Ein begrenzter Speicher ist eine Limitierung der bei Grafik, Musik/SFX und Programmdaten berücksichtigt werden muss. Man denke nur an die 64 KB RAM des C64 und was es allen Beteiligten die an einem größeren Projekt arbeiten (Demo oder Spiel ist dabei unberheblich) abverlangt. Beispiele dafür ist das Remake von Bomb Jack oder der neuen Version von Giana Sisters die am entstehen sind. Es verlangt von Grafiker(n), Musiker(n) und Programmierer(n) gleichermaßen Kompromisse und Lösungen (z. B. Grafikdaten im Speicher packen/depacken) um das bestmögliche Ergebnis zu erzielen.

Es ist halt ein Unterschied, ob die Limitierung (z.B. des Speichers) vorhanden ist, weil es technisch und/oder finanziell nicht mehr hergab (früher) oder ob man diese Limitierung rein willkürlich ohne äußere Notwendigkeit festgelegt hat (heute).

Eine Limitierung der Grafik oder des Sounds sehe ich deshalb anders (positiver) als eine Limitierung des Arbeitsspeichers. Grafik und Sound "sieht und hört" man. Das wirkt sichtbar. Ob man nun 64KB oder 4MB nutzt, sieht kein Mensch. Diese Limitierung sehe ich deshalb eher "nutzlos" in Hinsicht auf ein "8bit-Feeling". Ob z.B. die Levels für ein Spiel alle sofort im Speicher sind oder einzeln nachgeladen werden müssen, ist fürs Feeling pupsegal.

enthusi · 17. April 2019

Zitat von Snoopy

Ob z.B. die Levels für ein Spiel alle sofort im Speicher sind oder einzeln nachgeladen werden müssen, ist fürs Feeling pupsegal.

Das hat sogar ganz massiven Einfluss auf das Spiel- und Leveldesign.