Bots die URLs aus Tweets aufrufen
Nicht erst seit der SEO Campixx habe ich mir ein paar Gedanken über Christophs Analyse bzgl. des Einfluss von Tweets und fb-likes gemacht. Dabei kommen einem natürlich eine Menge Ideen, wie man seine eigenen Besucher dazu bekommt tweets und likes zu vergeben. Aber auch Gedanken darüber, wie man es evtl. manipulieren optimieren kann.
Dafür habe ich mir aber erst mal angeschaut, was genau passiert, wenn man eine URL bei Twitter postet.
Die Testumgebung war recht einfach:
- ein nagelneuer Twitter Account ohne Follower oder sonstige Verknüpfungen
- eine neue, unbekannte URL auf einer bisher nicht benutzten Domain
- Speicherung aller Aufrufe auf die neue URL (User Agent, IP, Timestamp)
- tweet der URL ohne hashtags oder sonstiger RT Bot Keywords
- Abwarten…
Hier also die Liste der Bots, die sich die URL aufgerufen haben.
(Timestamp des Tweets nach meinem Server: 1301688279)
HTTP_USER_AGENT => Mozilla/5.0 (compatible
REMOTE_ADDR => 46.20.47.43
REQUEST_TIME => 1301688280
HTTP_USER_AGENT => Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
REMOTE_ADDR => 66.249.66.181
REQUEST_TIME => 1301688280
HTTP_USER_AGENT => Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
REMOTE_ADDR => 72.30.161.216
REQUEST_TIME => 1301688280
HTTP_USER_AGENT => Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
REMOTE_ADDR => 67.195.115.170
REQUEST_TIME => 1301688280
HTTP_USER_AGENT => Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
REMOTE_ADDR => 72.30.161.216
REQUEST_TIME => 1301688281
HTTP_USER_AGENT => Voyager/1.0
REMOTE_ADDR => 38.113.234.181
REQUEST_TIME => 1301688282
HTTP_USER_AGENT => Mozilla/5.0 (compatible; Butterfly/1.0; +http://labs.topsy.com/butterfly/) Gecko/2009032608 Firefox/3.0.8
REMOTE_ADDR => 74.112.128.61
REQUEST_TIME => 1301688310
HTTP_USER_AGENT => Mozilla/5.0 (compatible; MSIE 6.0b; Windows NT 5.0) Gecko/2009011913 Firefox/3.0.6 TweetmemeBot
REMOTE_ADDR => 89.151.99.94
REQUEST_TIME => 1301688318
HTTP_USER_AGENT => Mozilla/5.0 (compatible; MSIE 6.0b; Windows NT 5.0) Gecko/2009011913 Firefox/3.0.6 TweetmemeBot
REMOTE_ADDR => 89.151.99.94
REQUEST_TIME => 1301688319
HTTP_USER_AGENT => Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)
REMOTE_ADDR => 65.52.21.120
REQUEST_TIME => 1301688336
HTTP_USER_AGENT => Mozilla/5.0 (compatible; Birubot/1.0) Gecko/2009032608 Firefox/3.0.8
REMOTE_ADDR => 50.17.248.24
REQUEST_TIME => 1301688492
HTTP_USER_AGENT => Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)
REMOTE_ADDR => 65.52.4.133
REQUEST_TIME => 1301690415
Ganz schön was los auf dem Server, wenn man nur einen kleinen Tweet mit URL hinterlässt. Die URL wurde übrigens nicht gekürzt.
Sehr guter Beitrag zum selben Thema mit ein paar mehr Informationen: what loads urls on twitter.
Mit diesen Informationen mag jetzt jeder das anfangen, was er will. Die Seite hatte übrigens nur wenig Mehrwert (ein kleines “haha”) und befindet sich jetzt, ca. 1 Stunde nach dem Posten, weder im Google Index, noch im Index von Bing.


