Es wurde ja schon gesagt, dass dies in vielen Programmiersprachen auf mehreren Wegen gelöst werden kann. Wie man das möglichst unkompliziert mit PHP machen könnte, kann ich dir in wenigen Sätzen erklären:
1.) Obwohl SimpleTest eigentlich ein Unit Tester für Entwickler ist, lassen sich die Klassen auch gut für andere Zwecke verwenden. So kann man damit auf einer Webseite "surfen", Eingabefelder ändern und Formulare absenden. Mit diesem Lösungsweg reichen schon ein paar Zeilen Code, um sich auf einer Internetseite einzuloggen und danach den HTML Sourcecode einer anderen Seite abzurufen. Der Code ist vergleichsweise übersichtlich und einsteigerfreundlich, denn man muss nicht manuell HTTP-Header basteln.
2.) Sobald man die Webseite, in der die gewünschten Daten vorhanden sind, aufgerufen hat, kann man diese mit einem regulären Ausdruck extrahieren. Zum Beispiel preg_match('%<div id="thisid">(.*?)</div>%i', $html_source, $results)
3.) PHP funktioniert auch als Kommandozeilen-Interpreter, egal ob auf Windows (php.exe) oder auf Linux-basierten Systemen. Man muss das Skript also nicht zwangsläufig im Browser ausführen und hat zudem die freie Wahl, was genau mit der Ausgabe gemacht werden soll -. ob eine direkte Ausgabe an die Kommandozeile gewünscht ist oder ob in eine Datei, Datenbank, etc geschrieben werden soll.
Alternativ, wenn du mit HTTRack zufrieden bist, kannst du auch findstr oder eine grep.exe (aus den Gnu Utils) verwenden, um die Ausgabe einer Datei zu filtern.