maddingamer
Cadet 3rd Year
- Registriert
- Mai 2014
- Beiträge
- 49
Moin Moin Zusammen,
(Kurz vorweg, ich habe was Python und generell Programmieren angeht nicht wirklich Erfahrung)
Ich möchte aus einer Tabelle einer Website (2 Spalten, 50 Zeilen) automatisch die erste Zeile auslesen und diese in eine fortlaufende eigene Tabelle speichern. Etwa alle 7 Minuten kommt in der 1. Zeile ein neuer Wert dazu und die Tabelle "rutscht" eine Zeile runter.
Das Auslesen der Tabelle habe ich hinbekommen, nur habe ich noch den HTML-Code der im Output stört, und ich weiß noch nicht wie ich das ganze zu einer fortlaufenden Datei/Datenbank o.Ä. speichern kann.
Hier der Code:
Als Output erhalte ich:
Da sollen natürlich eigentlich nur die Werte stehen..
Habe es schon mit
versucht, allerdings kommt dann als Output nur "Zeit"und kein Wert..
Vielleicht hat der ein oder andere ja eine Idee )
Vielen Dank schonmal!
(Kurz vorweg, ich habe was Python und generell Programmieren angeht nicht wirklich Erfahrung)
Ich möchte aus einer Tabelle einer Website (2 Spalten, 50 Zeilen) automatisch die erste Zeile auslesen und diese in eine fortlaufende eigene Tabelle speichern. Etwa alle 7 Minuten kommt in der 1. Zeile ein neuer Wert dazu und die Tabelle "rutscht" eine Zeile runter.
Das Auslesen der Tabelle habe ich hinbekommen, nur habe ich noch den HTML-Code der im Output stört, und ich weiß noch nicht wie ich das ganze zu einer fortlaufenden Datei/Datenbank o.Ä. speichern kann.
Hier der Code:
Python:
from BeautifulSoup import BeautifulSoup
import urllib2
response = urllib2.urlopen( "https://measurements.mobile-alerts.eu/Home/MeasurementDetails?deviceid=024241E85F13&vendorid=3ba9bbb5-aa69-49a0-9ece-36419a9230d9&appbundle=eu.mobile_alerts.mobilealerts")
html = response.read()
parsed_html = BeautifulSoup(html)
zeit = parsed_html.body.find("td", attrs={"class":"timestamp"})
wert = parsed_html.body.find("td", attrs={"class":"measurement"})
print("Messzeitpunkt:%s | Temperatur:%s" % (zeit, wert))
Als Output erhalte ich:
Code:
Messzeitpunkt:<td class="timestamp">05.08.2018 14:53:24</td> | Temperatur:<td class="measurement">8,3 C</td>)
Da sollen natürlich eigentlich nur die Werte stehen..
Habe es schon mit
Code:
import re
print (re.sub("<", " ", "zeit"))
Vielleicht hat der ein oder andere ja eine Idee )
Vielen Dank schonmal!