Programmierung eines Forums - URL Parameter entfernen

FrazeColder

Lt. Commander
Registriert
Okt. 2013
Beiträge
1.721
Hallo zusammen,

ich bin gerade dabei ein Forum in PHP zu programmieren und gerade dabei die Eingaben zu validieren. Sprich alles von Usern in Textfeldern eingegeben wird. Alle meine Textfelder liefern ein HTML Dom zurück und dieses möchte ich validieren.

Derzeit bin ich an dem Punkt wo es um Links (also a href's) geht. Ich denke es wäre sinnvoll alle GET Parametern in den URLs zu entfernen, da diese ggf. Affiliatelinks sein könnten oder sonstige Parameter wie z.B. utm_source und Co. da dranhängen.

Ich würde da zum einen gerne mal Eure Meinung dazu hören, ob ihr das für sinnvoll erhaltet oder nicht und dann habe ich noch ein Problem. Manche Webseiten, wie z.B. YouTube, nutze solche URLs allerdings mit GET Parametern um auf die jeweiligen Videos zu schalten. Für solche Internetseiten würde ich dann eine Whitelist anlegen, bei der ich die GET Parameter erlaube. Meine Frage ist nun, ob es da irgendwo eine Whiteliste gibt oder ob ich mir die selber zusammenstellen muss?

Falls ich mir die selber zusammenstellen muss, hier die zweite Frage: Welche Domains gibt es denn noch, die wie YouTube arbeiten? Mir fällt da zumindest keine größere Seite mehr ein..

Vielen Dank!
 
FrazeColder schrieb:
Derzeit bin ich an dem Punkt wo es um Links (also a href's) geht. Ich denke es wäre sinnvoll alle GET Parametern in den URLs zu entfernen, da diese ggf. Affiliatelinks sein könnten oder sonstige Parameter wie z.B. utm_source und Co. da dranhängen.
Sinnloses Unterfangen. Dann poste ich einen Link von einem Link Shortener und schon hab ich meine Query Params versteckt vor deinem Forum.

FrazeColder schrieb:
Welche Domains gibt es denn noch, die wie YouTube arbeiten?
So ziemlich alles von Google. Und noch Millionen andere Seiten.

Auf die Schnelle hab ich diese Lib gefunden, die dir das allen abnehmen sollte: http://htmlpurifier.org/
Keine Ahnung wie gut / verbreitet das Tool ist, aber grundsätzlich: Weniger Arbeit, weniger Bugs, mehr Zeit für wichtige Dinge.
 
  • Gefällt mir
Reaktionen: Aspethic, BFF und bart0rn
benneq schrieb:
Sinnloses Unterfangen. Dann poste ich einen Link von einem Link Shortener und schon hab ich meine Query Params versteckt vor deinem Forum.

So ziemlich alles von Google. Und noch Millionen andere Seiten.

Auf die Schnelle hab ich diese Lib gefunden, die dir das allen abnehmen sollte: http://htmlpurifier.org/
Keine Ahnung wie gut / verbreitet das Tool ist, aber grundsätzlich: Weniger Arbeit, weniger Bugs, mehr Zeit für wichtige Dinge.

Stimmt, hast Du Recht.. hab ich gar nicht dran gedacht mit dem Link Shortnerer...

Also ich habe gerade mal bei html http://htmlpurifier.org/ einen Amazon Affiliate Link in der Demo getestet... er gibt den Link genau wie bei der Eingabe wieder aus und der Affiliate Tag
 
FrazeColder schrieb:
Also ich habe gerade mal bei html http://htmlpurifier.org/ einen Amazon Affiliate Link in der Demo getestet... er gibt den Link genau wie bei der Eingabe wieder aus und der Affiliate Tag
Was soll das Teil auch sonst machen? Natürlich könntest du eine mehrere Gigabyte große Datenbank da einbauen, die sämtliche Webseiten mit ihren Zugehörigen Affiliate Links kennt, und die dann rausfiltert. Aber dann kannst du auch 'nen eigenen Server hinstellen, der sich ausschließlich um diese Aufgabe kümmert. Und zusammensammeln und aktuell halten müsste man den Bums natürlich auch noch.

Und dann stößt du auf das nächste Problem: Diverse Anbieter benutzen Subdomains (affiliateid.product.com) oder ganz normale Routen (www.product.com/affiliateid) für Affiliate Links.
 
FrazeColder schrieb:
Ich denke es wäre sinnvoll alle GET Parametern in den URLs zu entfernen
Ich denke es wäre sinnvoll nicht an URLs herumzupfuschen. Kein http:// oder https:// entfernen, kein www entfernen, keine schlaue Erkennung von Fehlern oder sonst irgendwas. Den Query-String abschneiden ist schon eine der dümmeren Ideen die mir untergekommen ist. Auch den Teil hinter dem "#" kannst du nicht abschneiden, z.B. MEGA-URLs nutzen ausschließlich diesen Teil der URL und der gewünschte content wird client-seitig vom javascript nachgeladen. Auch eine schlechte Idee ist auf http(s) zu limitieren, denn ftp://server.tld/ordner/datei und irc://network.org/channel sind genauso gültige URLs die Nutzer anklicken können.
Was man machen kann ist URLs erkennen und automatisch zu einem Link umwandeln, dies aber am Besten im Editor-Code im Frontend machen, damit ein Nutzer ggf. den Link wieder entfernen kann falls er es nicht will oder die Erkennung fehlerhaft war.
 
  • Gefällt mir
Reaktionen: r15ch13
Einige Foren erstellen aus URLs keine clickbaren Links (heise).
Andere Foren ersetzen Affiliate-Links einfach mit ihren eigenen Affiliate-Parametern (Computerbase)

"Gegen" das Internet zu entwickeln (GET Parameter entfernen / Whitelist verwenden, usw.) wird ein schweres Unterfangen.
 
  • Gefällt mir
Reaktionen: r15ch13
Zurück
Oben