DarkAngel2401 schrieb:
Ich denke, dass hier einfach alle Threads per wget/curl abgezogen wurden und 1:1 wie das html es hergegeben hat in das sql gedumped wurde.
Ja, mehr hatte ich bisher auch nicht gefunden. Aber man hätte so auch die einzelnen Themenübersichten auf diese Art und Weise "abziehen" können, was aber wohl nicht gemacht wurde.
Ich hatte mir von >
hier< den "Reader" per git geladen, die Datenbank hinzugefügt und anschließend den "ok.de-Reader" gestartet und konnte dann z.B. auf den Thread 14.000, Seite 2 im Browser per
http://localhost:3000/topic/14000:2
oder
http://localhost:3000/forum/showthread.php?t=14000&page=2
(bzw. anstatt localhost oder 127.0.0.1 die IP-Adresse des Gerätes auf dem der Reader läuft) zugreifen (BTW, die 2. Variante ist besser weil man sich dann einfacher durch die Seiten des jeweiligen Thread durchklicken kann). Die originale/ursprüngliche URL dazu lautete ja
https://www.onlinekosten.de/forum/showthread.php?t=14000&page=2
.
Aber in der ReadMe gibt es keine Erwähnung ob mehr als nur die reinen Threads mit all ihren Seiten gesichert wurden und wenn ja, wie man die mit dem ok.de-Reader abrufen könnte. Die URL z.B. für den Einstieg in die Themenübersicht im Bereich "Internet via Telefonkabel" lautete
https://www.onlinekosten.de/forum/forumdisplay.php?f=91
aber wenn man
http://localhost:3000/forum/forumdisplay.php?f=91
abruft erhält man nur folgendes zurück:
Code:
statusCode 404
message "Cannot GET /forum/forumdisplay.php?f=91"
error "Not Found"
Eine andere Route als
/forum/showthread.php?t=<topic>&page=<page>
scheint es auch gar nicht zu geben beim ok.de-Reader. Aber vielleicht gibt es noch was anderes als "topic"?
Edit:
Gerade eben noch einmal den ok.de-Reader gestartet/angeschaut. Nein, es gibt leider nichts anderes als "topic" und "forum" wobei forum auch nur für die o.g. Route verwendet wird.