Goudengids

Goudengids.be e-mail

How to steal e-mail addresses from the yellow pages? Sorry folks, but this tutorial is in dutch.

Wat?

Dit project is een proof of concept die aantoont hoe simpel het kan zijn om gegevens te "stelen" van een website. Niet te min mag ik zeggen dat de gegevens toch goed beveiligd zijn ...

Stap 1: De Website bekijken & analyseren

Wanneer we een adres opzoeken in de goudengids hebben we de mogelijkheid om een e-mail te zenden naar dat bedrijf indien dit e-mail adres gekend is bij de Goudengids. Uiteraard zijn deze e-mail adressen beveiligd zodat je deze niet zomaar uit de html kunt halen, het zou anders te eenvoudig zijn om e-mail adressen te verzamelen voor het gebruik van mailinglijsten.

Wanneer we op de e-mail link klikken van de Goudengids, dan opent deze zich in uw e-mail client waar deze perfect leesbaar is. In principe kunnen we een eigen applicatie schrijven die we koppelen aan de "mailto"-tag. Daarna kunnen we eenvoudig een script maken die elke link op de pagina aanklikt. waarna onze eigen applicatie het e-mail adres opslaat.
OF
we kunnen proberen het e-mail adres te achterhalen op een andere manier zoals rechtstreeks uit de html te filteren ...
Wanneer we de eigenschappen opvragen van zo'n e-mail link zien we het volgend stukje javascript.

void("id=nl_BE_YP_PAID_228036_0000_1242012_7665_2007061570765001|email=_eaW5mb0BhbGxpYW5jZWZyLmJl")

Hoe dit stukje werkt zal ik niet van de hand doen ... wel zien we duidelijk de variable "email" met de gecodeerde waarde.

Stap 2: Gegevens ophalen

Net zoals in de Web Scraping tutorial zullen we de HTML downloaden. waarna we deze gaan analyseren door middel van Regulaire Expressies. Wanneer we een gecodeerd e-mail adres vinden gaan we deze meteen decoderen en wegschrijven naar een textfile.

Public Function HTML(ByVal sURL As String) As String
    Dim oClient As New WebClient
    Dim oStreamReader As New StreamReader(oClient.OpenRead(sURL))
    Return oStreamReader.ReadToEnd
End Function

Besluit

Goudengids E-Mail De broncode wordt NIET vrijgegeven, dit is puur een "Proof-of-Concept" Ook op vraag wordt de broncode NIET vrijgegeven!

De huidige applicatie (zie screenshot)