W3C validator en Google’s cloakingdetectie misleiden

Vandaag weer iets nieuws uitgevonden. Op dit moment ben ik bezig om een website te maken voor een klant. Nadat ik altijd klaar ben met het schrijven van de HTML en CSS, controleer ik deze altijd op fouten via de W3C validator.

Ik werd er onterecht op gewezen, dat ik tekst gebruikte die dezelfde kleur had als de gebruikte achtergrondkleur:

“Same colors for color and background-color in two contexts”

Als de validator nou wat slimmer was geweest, dan had deze kunnen constateren dat een kleurrijke achtergrondafbeelding werd gebruikt. Hierop is de witte tekst juist duidelijk te lezen.

Nu is er eigenlijk helemaal geen probleem en probeert de W3C validator mij alleen maar te behoeden voor mogelijke fouten. Echter, is dit niet helemaal waar. Onleesbare tekst is een veelvoorkomende illegale truc om je website hoog te laten scoren in zoekmachines, wanneer mensen hierin bepaalde zoekwoorden invullen. Deze techniek wordt ook wel cloaking genoemd … en dat mag niet van Google:

“(…) Verborgen tekst of links in uw inhoud (…) zoals witte tekst gebruiken op een witte achtergrond (…) wordt uw site mogelijk verwijderd uit de index van Google en verschijnt deze niet meer op pagina’s met zoekresultaten.”

Ik zat eraan te denken dat Google tijdens de analyse van een website mogelijk ook dezelfde conclusie trekt als het W3C. Google heeft reeds – zoals de geruchten gaan – technieken in gebruik waarop deze automatisch controleert of websites van cloakingtechnieken gebruik maken. Reden genoeg om te voorkomen dat een negatieve reputatie ontstaat bij Google en tijd om analysesoftware te misleiden.

De software controleert of de achtergrondkleur (bijvoorbeeld #ffffff) exact overeenkomt met de tekstkleur (bijvoorbeeld ook #ffffff). Door een minuscule en voor de mens onzichtbare verandering in de kleur aan te brengen, klopt de vergelijking al niet meer. Op deze manier kan analysesoftware worden misleid – want #ffffff is wiskundig gezien niet gelijk aan #fffffe. De foutmeldingen verdwijnen zo bij het W3C als sneeuw voor de zon.

Mocht Google nou een gelijksoortige opzet hanteren voor kleurvergelijking, dan betekent dit dat ontwikkelaars met de gegeven methode een onjuiste analyse van Google foutmeldingen op de W3C validator kunnen voorkomen. Natuurlijk betekent dit ook dat ontwikkelaars die cloakingpraktijken er op na houden, een vergelijkbare methode kunnen gebruiken om dit te verhullen ten opzichte van analysesoftware.

About Sijmen Ruwhof

Independent IT Security Researcher / Ethical Hacker
This entry was posted in Google, search engine optimization, w3c. Bookmark the permalink.