Hallo Boardies,
hoffentlich passt mein Thread einigermasen in diesen Bereich.
Ich benötige Hilfe mit einer Regular Expression (Regex), die mir beim Suchen gewissen Stichwörter in einem HTML Dokument helfen soll.
So sieht das immer wiederkehrende Muster des HTML Codes aus:
Code:
Alles was als WICHTIG betitelt ist möchte ich herauspicken.
Man könnte also sagen, alles zwischen <strong> und <a href=".
Ich habe mir bereits ein Regex zusammengeschustert, das Text zwischen zwei HTML-Tags findet, jedoch nicht über mehrere Zeilen wie es im obigen HTML-Code ist.
Kann mir kemand von euch weiterhelfen?
Was mache ich falsch?
Vielen Dank.
hoffentlich passt mein Thread einigermasen in diesen Bereich.
Ich benötige Hilfe mit einer Regular Expression (Regex), die mir beim Suchen gewissen Stichwörter in einem HTML Dokument helfen soll.
So sieht das immer wiederkehrende Muster des HTML Codes aus:
Code:
HTML:
<tr>
<td width="170px">
<img src="imgsource" />
</td>
<td>
<strong>WICHTIG</strong><br />
WICHTIG<br />
WICHTIG<br />
WICHTIG<br />
<a href="URL" target="_blank">Text</a><br />
<br />
</td>
</tr>
<tr>
<td colspan="2" style="border-bottom: 1px solid #ccc;"></td>
</tr>
Alles was als WICHTIG betitelt ist möchte ich herauspicken.
Man könnte also sagen, alles zwischen <strong> und <a href=".
Ich habe mir bereits ein Regex zusammengeschustert, das Text zwischen zwei HTML-Tags findet, jedoch nicht über mehrere Zeilen wie es im obigen HTML-Code ist.
Dieser Regex findet z.B. alles zwischen <strong> und </strong><br />, jedoch habe ich es nicht geschafft, dass er alles zwischen zwei Tags, welche nicht in der selben Zeile sind findet.(?<=<strong>).*?(?=</strong><br />)
Kann mir kemand von euch weiterhelfen?
Was mache ich falsch?
Vielen Dank.