Spam referer : le script
» Posté le 28 juil 2009
Suite à un article du site SEO Blackout, j’ai mis au point un outil pour effectuer du spam referrer. J’ai créé cet outil uniquement à titre de démonstration car ce type de référencement ne m’intéresse pas. Je ne suis donc pas responsable de l’utilisation que vous en faites ! ![]()
Je suis disponible si vous avez besoin d’explication.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 | #!/bin/bash #-----------------------------------------------------------------------# # # # Description : Spam referrer auto # # OS : Linux # # Requires : curl, lynx, tor (yum or aptitude install curl lynx tor) # # Licence : Creative Commons BY-NC-SA 2.0 # # Version : 0.0.1 # # Author : Olivier TASSEL <blog CHEZ olivier-tassel.fr> # # Web site : http://www.olivier-tassel.fr/ # # Note : L'utilisation de Tor n'est pas obligatoire mais a le # # mérite de masquer son IP de façon efficace. Si vous ne # # souhaitez pas utiliser Tor, supprimer l'option --socks5 # # # #-----------------------------------------------------------------------# # Variables nbResultat="20" header="User-Agent: Mozilla/5.0 (X11; U; Linux i686; fr; rv:1.9.1.1) Gecko/20090715 Firefox/3.5.1 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3 Accept-Charset: ISO-8859-1;q=0.7,*;q=0.7 Keep-Alive: 300 Connection: keep-alive" # Header repris de Firefox pour me faire passer pour un navigateur web (et donc un humain) au lieu d'un bot url="http://www.google.fr/search?hl=fr&q=%22Top+*+of+*+Total+Referrers%22+site%3Aedu+inurl%3Ausage_200905.html&btnG=Recherche+Google&meta=&aq=f&oq=" # Sites .edu monSite="http://www.google.fr" # Indiquer le nom de votre site qui sera utilisé pour recevoir les backlinks tor="127.0.0.1:9050" # Par défaut, adresse du proxy Tor (cf http://doc.ubuntu-fr.org/tor pour l'installation sous ubuntu / debian) # Variables de boucles et divers j=0 curl --cookie-jar cookie.txt --location --silent --header "$header" "http://www.google.fr" 1>/dev/null # Je récupère le cookie Google sleep 10 # Je collecte les backlinks while [ ! $j = $nbResultat ] do myURL=$url"&sa=N&start=$j" curl --cookie cookie.txt --silent --location --header "$header" --referer "http://www.google.fr/" "$myURL" -o tmp.html # je récupère les résultats lynx -dump -listonly tmp.html > tmp sed 's/ http/\^http/g' tmp | tr -s "^" "\n" | grep http | grep -v google.fr | grep -v google.com | grep -v localhost | grep -v "search?q=cache" | grep -v "oi=translate" | grep -v youtube.com >> result # Remove google cache and translate result cat tmp.html j=$(( $j + 10 )) # J'incrémente la variable j pour passer de page en page myURL="" # Je réinitialise la variable rm tmp.html tmp sleep 10 # Je mets la boucle en pause pour éviter le captcha Google done # Maintenant j'ai mon fichier contenant les backlinks à spammer donc j'attaque :-) for backlink in $(cat result); do curl --socks5 "$tor"--silent --header "$header" --referer "$nomSite" "$backlink" # je récupère les résultats echo "Spam referer du site de la page $backlink en cours..." # Progression du spam referer done rm result cookie.txt |
Olivier TASSEL



12 h 10 min on juillet 28th, 2009
Merci pour ce script, pour l’utiliser avec tor je suppose que tu utilise juste torify exact ?
12 h 11 min on juillet 28th, 2009
Désolé j’aurais du lire plus attentivement
13 h 12 min on juillet 28th, 2009
Sympa ton script, je vais tester ça
13 h 14 min on juillet 28th, 2009
Merci.
Bon normalement j’ai fait en sorte qu’il passe au travers des griffes de Google (j’ai repris le header de firefox quasi complet de firefox, le cookie est là,…)
10 h 08 min on juillet 29th, 2009
Sympa, je vais tester aussi.
Ca change les scripts en bash.
Bonne continuation pour ton blog.
12 h 17 min on juillet 29th, 2009
Merci pour le mettre à disposition. Je ne le testerai pas de suite mais je le garde au chaud pour plus tard.
12 h 15 min on août 21st, 2009
Bonjour,
Désolé je suis entièrement novice dans le domaine, mais comment utiliser ce script?
Merci de votre aide
18 h 15 min on août 21st, 2009
Bonjour,
Ce script s’utilise sous Linux. Il vous faut renseigner la variable nomSite par le nom de votre propre site et lancer le script via console en l’ayant rendu exécutable au prealable.
20 h 49 min on août 24th, 2009
[...] les adeptes du shell, Olivier Tassel nous propose sur son blog un script shell de spam referrer. Ces icones representent les sites de bookmarking social dans lesquels vos lecteurs peuvent [...]
16 h 44 min on août 26th, 2009
Super! Merci pour ce petit script bien utile.
Je viens de le tester… si ce n’est que j’utilise privoxy+tor.
Ca fonctionne impec.
thx.
Chris
1 h 37 min on août 27th, 2009
Hello,
Merci pour le script.
Est ce qu’a la place du proxy tor on peut mettre un autre proxy?
genre: tor: »174.142.24.201:3128″ (proxy trouvé sur google)
Merci
14 h 22 min on août 27th, 2009
@Tom
Tu peux utiliser un simple proxy à la place de Tor. Extrait du man curl qui indique la syntaxe à utiliser :
-x/–proxy
17 h 09 min on août 27th, 2009
C’est un très chouette script Bravo !
Maintenant, en bidouillant un peu, je pense qu’on pourrait de même en php ou en perl non ?
23 h 09 min on août 27th, 2009
@Jean
Pour un script en PHP : je t’invite à voir l’article rédigé par lemoussel http://www.seoblackout.com/2009/08/24/script-php-spam-referer/
J’ai ma préférence pour les scripts bash car l’utilisation des programmes comme curl, tor,…est plus aisée qu’en PHP. Cependant, il est tout à fait possible de faire des scripts PHP utilisable en ligne de commande (je le fait dès que j’ai besoin d’une communication avec un serveur MySQL).
23 h 54 min on septembre 5th, 2009
Bonsoir Olivier,
merci pour le script mais j’ai plus une question sur Tor.
Je suis sur linux et je galère avec l’utilisation de Tor.
Pour l’install de tor, privoxy voire vidalia no problemo, mais dès que je lance Tor et que je teste si je suis anonyme (via ce site https://check.torproject.org/), il s’avère que mon ip n’a pas changé.
Aurais tu une idée par hasard ?
Merci d’avance.
PS: je suis chez free, y aurait il une manip à faire sur le routeur ou bien dans un des fichiers de conf de tor/privoxy ?
12 h 52 min on septembre 6th, 2009
Bonjour,
Je me suis aperçu que la catchapca de Google bloque malheureusement le crawl.
En abaissant le délai du sleep de 10 à 20 secondes cela ne change pas
17 h 11 min on septembre 11th, 2009
@blob
) serait aussi d’avoir un serveur avec plusieurs ip (par exemple des IP Failover). Le man de curl indique qu’on peut utiliser l’option –interface pour basculer d’une IP à une autre. Il ne reste plus qu’à implémenter une fonction qui fait basculer d’une ip à une autre à chaque page parsée !
Une solution pour éviter le captcha de Google (et non le catchapca
17 h 13 min on septembre 11th, 2009
@stone
Je suis chez free également et je ne rencontre pas ce problème (et je n’ai pas fait de modif particulière sur le routeur). Vérifie si ton firewall (iptables ?) ne bloque pas les ports en rapport avec Tor / privoxy
20 h 48 min on septembre 14th, 2009
Je teste demain, ce soit soirée effaçage à la main de milliers de ligne du Save de BDD après crash, f*uck Joomla.
Je te dite quoi demain.
9 h 04 min on septembre 18th, 2009
Ho drole d’idée, en terme d’apport de pertinence, carrement etonnant
12 h 45 min on septembre 19th, 2009
@chaudiere,
)
Les BL apportés ne sont pas pertinents dans le sens où l’environnement sémantique du lien peut ne pas être optimale (sauf si le site visé a la même thématique -> dans ce cas, c’est tout benef
Cependant, c’est un BL quand même et cela permet de profiter de la popularité du site en question !
2 h 07 min on octobre 5th, 2009
@Olivier
Et ça marche pour les sortes d’annuaire Top referrer qui font des classements par hit?
17 h 39 min on octobre 24th, 2009
@protoss33
Si le webmaster ne fait pas ce classement manuellement, oui ça marche. Par contre, la discrétion est de rigueur…(ne pas s’amuser à truster la première place systématiquement !)
12 h 03 min on novembre 22nd, 2009
Bonjour,
Ou doit être placé ce script pour le tester ?