Wolly300
Lieutenant
- Registriert
- Mai 2014
- Beiträge
- 514
Hallo zusammen,
ich will für ein Projekt von mir Webseiten auslesen und stoße gerade so gegen mein Wissenslimit.
Ich versuche aktuell mit der HtmlUnit Bibliothek mein Vorhaben umzusetzen, scheitere aber daran, das trotz aktivierung die Webseite sagt das Cookies blockiert sind und mein Browser veraltet ist.
Kennt ihr noch andere Bibliotheken für solch ein Vorhaben oder habt ihr schon einmal etwas funktionierendes mit dieser Bibliothek gemacht?
Hier mal kurz mein Test Code für HtmlUnit:
Bei den ersten 3 isEnabled abfragen kommt überall true raus, das ist auf jeden schon mal an.
Aber der Browser sagt etwas anderes:
Ich bekomme dutzende Fehlermeldungen über veraltete content types:
Danke für euere Hilfe.
ich will für ein Projekt von mir Webseiten auslesen und stoße gerade so gegen mein Wissenslimit.
Ich versuche aktuell mit der HtmlUnit Bibliothek mein Vorhaben umzusetzen, scheitere aber daran, das trotz aktivierung die Webseite sagt das Cookies blockiert sind und mein Browser veraltet ist.
Kennt ihr noch andere Bibliotheken für solch ein Vorhaben oder habt ihr schon einmal etwas funktionierendes mit dieser Bibliothek gemacht?
Hier mal kurz mein Test Code für HtmlUnit:
Java:
try (final WebClient webClient = new WebClient(BrowserVersion.CHROME)) {
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.getCookieManager().setCookiesEnabled(true);
System.out.println(webClient.isJavaScriptEnabled() + " - " + webClient.isJavaScriptEngineEnabled());
System.out.println("Cookies: " + webClient.getCookieManager().isCookiesEnabled());
final HtmlPage page = webClient.getPage("https://www.bauhaus.info/fi-schutzschalter/abb-system-pro-m-compact-fi-schutzschalter-f-204/p/12244967");
print_file(page);
print_cookies(webClient);
} catch (Exception e){
}
Aber der Browser sagt etwas anderes:
HTML:
In Ihrem Browser sind Cookies blockiert. Um unseren Online-Shop nutzen zu können, aktivieren Sie Cookies innerhalb Ihrer Browsereinstellungen. Sollten Sie Hilfe bei der Änderung Ihrer Browsereinstellungen benötigen, konsultieren Sie bitte die Website des Browserherstellers.
Sie verwenden einen veralteten Browser, mit dem nicht alle Inhalte korrekt dargestellt werden können. Um unseren Online-Shop nutzen zu können, empfehlen wir Ihnen, die aktuellste Version Ihres Browsers zu installieren. Sollten Sie Hilfe benötigen, konsultieren Sie bitte die Website des Browserherstellers.
Ich bekomme dutzende Fehlermeldungen über veraltete content types:
Java:
März 07, 2022 8:38:32 PM com.gargoylesoftware.htmlunit.IncorrectnessListenerImpl notify
WARNING: Obsolete content type encountered: 'text/javascript'.
März 07, 2022 8:38:33 PM com.gargoylesoftware.htmlunit.IncorrectnessListenerImpl notify
WARNING: Obsolete content type encountered: 'application/x-javascript'.
März 07, 2022 8:38:33 PM com.gargoylesoftware.htmlunit.javascript.DefaultJavaScriptErrorListener scriptException
SEVERE: Error during JavaScript execution
März 07, 2022 8:38:33 PM com.gargoylesoftware.htmlunit.IncorrectnessListenerImpl notify
WARNING: Obsolete content type encountered: 'text/javascript'.
Danke für euere Hilfe.
Zuletzt bearbeitet: