Знаю, что тема баян, но кому-то, может, сослужит пользу. Пока генератор грузит сервер, решил написать заметку, в которой подытожить побольше факторов, по которым можно определить автоматом доры. Если true, то это не всегда 100% дор, некоторые пункты могут просто повышать вероятность. Собственно, Америку не открываю, но тем, кто пишет красные полуавтоматы будет удобно. Ну и полезно обсудить. Может, не согласны с чем-то? Или дополните?

- IP. Блок 255 IP стоит 100 баксов в месяц. Т.е. можно себе позволить. Правда, они с одной под-сети…а потому можно проследить всю сеть, но имхо слишком много ресурсов на это надо, плюс делает так очень мало людей, а потому сомневаюсь, что поисковики заморачиваются таким глубоким анализом. Ну и чтоб IP забанили – это тоже постараться нужно!
- ns-servers. Пинглав говорил, что можно как-то динамически делать, но я от такого далек (http://dustman.net/andy/djbware/MySQLdns вот ссылка какая-то есть по теме, вроде).
- Whois. По моим наблюдениям, идет бан по е-мэйлу в хуизе. Но могут любую графу использовать. В общем, лучше whois генерировать рандомом на каждый домен. Кому надо, тот знает или найдет: сейчас у регистраторов уже все есть: вбиваешь пачку имен доменов и все автоматом генерирует/регистрирует (а у полуавтомата еще и есть функция автодобавления доменов на сервак, автогенерация…)- Динамика добавления. Тут отмечу, что все эти пункты не 100% юзаются поисковиками. Просто отмечаю моменты, где можно спалится. Так вот, например, новый IP, новые нс-сервера.. и в один день опа! И 100 доменов на них. И все зарегистрированный в этот же день. Правдоподобно для белых выстраданных проектов? А еще если и на каждом по 30К страниц?
- Впрочем, про страницы – это отдельный пункт. Опа! И на новом домене 30К страниц. Тоже должно вызвать подозрение и быть одним из факторов бана ботом (насобирается критический процент совпадений по таким факторам и получай бан. А если вдруг как-то получится, что белый сайт забанили, то редко и после письма разбанят, отписав что-то типа «господи, что за аномалии!.. мы посмотрим че за нафиг и сообщим вам»).
- Шаблоны доров. Я лично этому пункту уделаю очень низкий приоритет. Не знаю как гугл, а в яндексе.. Я стою на позиции, что яндекс такой же распиздяй в плане уникальности, как я в дорстрое. Но отметить стоит. А если на одном айпи, на одних нс-серверах, на сегоднязарегенных ста доменах появится по 30К страниц (на домен) с одним шаблоном.. это подозрительно
- Уникальность контента. Возможно, и человечность текстов (интересно, поисковиков новинкам в жаргонах учат?
(ответ от меня: да, пользователи и учат))
- Структура сайта… Думаю, тоже можно было бы отнести к низкоприоритетному фактору. На хорошем сайте будет несколько типов страниц. В разных разделах будет отображаться информация разного формата и в разных шаблонах. А на дорах чаще всего один-два типа страниц (аля «контент» и страницы перелинковки (которых может и не быть, ведь перелинковка и внутри страниц идет)). Можно еще и структуру каталогов рассмотреть: сделать на одном домене разные шаблоны имен файлов, на каталоги/сабдомены по-разному разбивать.
- Перелинковка тоже спалить может. Как сделать, чтоб не палила? А никак. Перелинковка и создана для того, чтоб палить. Т.е. надо просто делать ее правдоподобной и то кто линкуется чтоб не вызывал подозрений у ботов (а если негры выдачу мониторят, то тут ничего глобально не спасет).
- Так же палевно то, как добавляются доры. Вот купили сервак, забацали 1К доменов. И как их сразу добавить? Спам – палево. Аддурл в таких объемах – палево. Имхо, тут только линками индексатора приводить. Это должен быть не спам, а буквально по пару линков с разных ресурсов, разными способами… целый комплекс разнообразных вариантов. При том можно не на 1К доменов линки ставить, иначе от перелинковки доров смысла мало и ее делать не стоит.
- Активность посетителей. Если 1 хост – это 1 уник, то сайт явно дерьмо. На среднего поискового юзера на белом сайте 2-4 просмотренные страницы. Как этот пункт обходить хз, но водить его по дору - рисковать конвертацией (но у меня есть практика, когда это повышает конвертацию)
- Кейворды. Когда во всех страницах кругом одни кейворды – это тоже немного подозрительно. У белых сайтов почти всегда куча неоптимизированных левых страниц.