Hallo Forum,
ich möchte den Inhalt einer Webseite einlesen. Leider erhalte ich dabei nicht alle Elemente die im Browser zu sehen sind, sondern nur einen string der dem "Seitenquelltext anzeigen" entspricht.
Die Abfrage erfolgt damit:
Dabei fehlt der "Assets" Block mit den Downloads der Github Seite. Sprich dieser Block landet nicht in content.
Wie muss der Aufruf hierfür angepasst werden ?
Das besondere an "Assets" ist, daß die Links der Downloads von der Webseite nachgeladen werden.
Allerdings sollte client.GetStringAsync(uri) m.M.n. erst dann mit einem string zurückkehren, wenn die Seite vollständig aufgebaut wurde. Falsche Erwartung ?
Danke schonmal
PS: Das "Warum" in der Frage fragt warum der Code nicht das erwartete liefert. Nicht ob Webseiten dynamische Bestandteile haben können.
ich möchte den Inhalt einer Webseite einlesen. Leider erhalte ich dabei nicht alle Elemente die im Browser zu sehen sind, sondern nur einen string der dem "Seitenquelltext anzeigen" entspricht.
Die Abfrage erfolgt damit:
Code:
HttpClient client = new();
string uri = "https://github.com/notepad-plus-plus/notepad-plus-plus/releases/latest"
var content = await client.GetStringAsync(uri).ConfigureAwait(false);
Dabei fehlt der "Assets" Block mit den Downloads der Github Seite. Sprich dieser Block landet nicht in content.
Wie muss der Aufruf hierfür angepasst werden ?
Das besondere an "Assets" ist, daß die Links der Downloads von der Webseite nachgeladen werden.
Allerdings sollte client.GetStringAsync(uri) m.M.n. erst dann mit einem string zurückkehren, wenn die Seite vollständig aufgebaut wurde. Falsche Erwartung ?
Danke schonmal
PS: Das "Warum" in der Frage fragt warum der Code nicht das erwartete liefert. Nicht ob Webseiten dynamische Bestandteile haben können.
Zuletzt bearbeitet: