Die Sortierung nach Ausgabe ist jetzt optional verfügbar (Relevanz ist immer noch default) und man kann die Teillisten jetzt ein- und ausklappen. Momentan ergibt das noch keinen Sinn, weil es nur eine Teilliste gibt (eben für die Happy Computer), aber wenn später mehr dazu kommt, dann ist das nützlich, um die Liste übersichtlicher zu halten.
Kann sein, dass ihr den Browsercache einmal treten müsst, damit der Styles und Skripte neu zieht.
Suchmaschine für Zeitschriften - Alphaversion
- EgonOlsen71
- Thread is Unresolved
-
-
Super Sache,
was für eine Suchmaschine hast du denn genommen, Lucene, Solr etc.?
Man könnte ja auch noch eine KI mit den Daten trainieren um dann damit suchen zu können
-
Super Sache,
was für eine Suchmaschine hast du denn genommen, Lucene, Solr etc.?
Man könnte ja auch noch eine KI mit den Daten trainieren um dann damit suchen zu können
Lucene. Eine KI müsste dann aber eine lokales oder zumindest freies Modell sein. Sonst zahlt man sich bei der Textmenge dumm und dusselig. Ich habe sowas mal gemacht, um Zusammenfassungen zu generieren und um Seitenstrukturen zu analysieren (wo ist Werbung, wofür und wie groß ist die). Aber ich glaube, in diesem Kontext hier hat das nicht so den Mehrwert zumal der erkannte Text zwar ganz OK ist, aber auch viel Unsinn enthält.
-
Stimmt.
Ich finde es aber schon super das du sowas wie lucene einsetzt, die ist schon ziemlich performant.
-
Die 64er ist komplett drin (ohne Sonderhefte...ich bin nicht sicher, wie sinnvoll die sind ... das sind ja eher Content-Recyclinghefte, die bereits erschienene Artikel bündeln, oder?), ebenso wie die HC - Mein Home-Computer. Also nächstes würde ich die RUN machen.
-
Pack mal mit in deine Signatur
-
Quote
das sind ja eher Content-Recyclinghefte
Teils-teils. Mein spezial 61K "Turbo Tape" war zum Beispiel nur im Sonderheft 15.
-
Ich glaube , da war noch so einiges andere auch nur in den Sonderheften.
-
Ich glaube , da war noch so einiges andere auch nur in den Sonderheften.
Ja, oooooook...
Dann ziehe ich die noch nach. "Leider" sind das echt viele.
-
Ja, oooooook...
Dann ziehe ich die noch nach. "Leider" sind das echt viele.
Das stimmt allerdings. Aber ich finde es voll cool was du da machst.
-
Ich nehme an die Suche findet dann auch Werbeanzeigen? Ich habe aus Spaß mal "Action Replay" eingeben, und da finden sich ca. 30 Einträge für die 64er. Zielgenau Berichte für das "Action Replay" lassen sich so aber nicht gut finden. Müsste man wohl PDFs ohne Werbeseiten nutzen, um es genauer zu machen.
-
Ein super Projekt
Das erleichtert dann doch etwas die Recherche bestimmter Themen.
-
Ich habe noch die Option ergänzt, Begriffe auszuschließen. Das geht, indem man einfach "!" oder "-" vor das Wort schreibt. Also wenn man z.B. nach "Knezovic" sucht, bekommt man drei Treffer. Will man aber keine Claudia dabei haben und sucht nach "Knezovic -Claudia" oder "Knezovic !Claudia", dann bekommt man nur noch zwei.
Jaaa...weiß auch nicht, ob das sehr sinnvoll ist. Aber es ging halt.
-
Ich nehme an die Suche findet dann auch Werbeanzeigen? Ich habe aus Spaß mal "Action Replay" eingeben, und da finden sich ca. 30 Einträge für die 64er. Zielgenau Berichte für das "Action Replay" lassen sich so aber nicht gut finden. Müsste man wohl PDFs ohne Werbeseiten nutzen, um es genauer zu machen.
Ja, alles! Werbung, Kleinanzeigen, Leserbriefe, Komplettlösungen...das bekommst du technisch nicht gefiltert und je nach Anwendungszweck willst du das auch gar nicht. Ich gebe zu, dass es das erschweren kann, Dinge zu finden. Aber ist halt schwierig: Der eine will einen Testbericht zum Thema "XYZ", der andere die bunte Werbung dazu und die dritte sucht ihren Leserbrief dazu.
Manchmal hilft es, dann nach Ausgabe statt nach Relevanz zu sortieren. Und/oder mit "Tüddelchen" suchen (habe ich aber eben erst eingebaut...
), also "Action Replay" statt Action Replay. Beispiel: Mit Geos nach Amerika findet alle Seiten mit den Begriffen Geos, Amerika, mit und nach (und das sind wirklich erstaunlich viele!). "Mit Geos nach Amerika" findet nur Seiten, auf denen das so steht.
-
Die RUN ist jetzt auch drin, jedenfalls soweit ich Scans hatte.
-
Wäre es möglich, die Suche so zu erweitern, dass nur Treffer gemeldet werden, wenn die Suchwörter exakt wie angegeben im Text vorkommen? Oder geht das schon und ich weiß nur nicht wie?
Ich habe gerade "userport schutzschaltung" suchen lassen und bekomme als relevantesten Treffer die 64er 11/1987 Seite 84 ausgegeben:
Nur findet sich in der Ausgabe 11/1987 in der ganzen Zeitschrift keine "Schutzschaltung", zumindest wenn ich im Bereich der Seite 84 rum suche oder die Suchfunktion von Archive.org auf dieses Heft starte:
https://archive.org/details/64…ode/1up?q=Schutzschaltung
"Schutz" findet man dann Einige, aber die will ich nicht.
Ich würde mir ganz naiv die Seiten anzeigen lassen wollen, die sowohl "Userport" als auch "Schutzschaltung" im Text haben (ohne Beachtung der Groß- und Kleinschreibung). Alles andere (so ähnlich oder ähnlicher Wortstamm ... ) interessiert mich eher weniger.
-
Nur findet sich in der Ausgabe 11/1987 in der ganzen Zeitschrift keine "Schutzschaltung"
Doch, auf Seite 84 in der Werbung (oben rechts).
-
Nur findet sich in der Ausgabe 11/1987 in der ganzen Zeitschrift keine "Schutzschaltung"
Doch, auf Seite 84 in der Werbung (oben rechts).
Wie konnte ich das bei der Ausgabe von archive.org nur übersehen?
Danke! Dann sucht die Suchseite genauer als ich nachlesen kann.
-
Danke! Dann sucht die Suchseite genauer als ich nachlesen kann.
Ich glaube, ich habe mein PDF aus der F64-Wolke, bin aber nicht ganz sicher.
-
Danke! Dann sucht die Suchseite genauer als ich nachlesen kann.
Thou shalt not question the might of the search!
Ist mir aber bei meinen Kontrollen auch passiert, dass ich gedacht habe "Alter, wieso kommt diese Seite jetzt?"...aber es hat immer irgendwie gestimmt. Die unscharfe Suche ist nicht soooo unscharf und vor allem ist das Ergebnis dann niedriger priorisiert. Mittlerweile ist es so, dass die eingegebenen Begriffe als Ganzes am höchsten zählen (also in deinem Fall "userport schutzschaltung"), dann, mit niedrigerer Gewichtung, kommen die Einzelworte, dann die Einzelworte in unscharf und dann sowas wie Stemming.
P.S.: Was soll das in manchen Scans eigentlich mit dem Verschwurbeln der Werbung? Was soll da vor wem geschützt werden? Ich meine, Rechtliches kann das ja eigentlich nicht sein. Ich "klaue" das ganze Heft aber bei der Werbung puller ich mich dann ein und mache die unkenntlich? Wäre ja so, als wenn ein Einbruch ok ist, wenn man sich vorher die Schuhe abtritt...