IndigoMan

Рейтинг
114
Регистрация
29.10.2010
Drafter1:
Да ошибся он подходит, но так же там не все профили в индекс попадают, надо их скармливать

Второй посмотрел - тоже нету в роботс запрета, но есть сам файл роботс, вы проверяете его наличие и за счет этого сразу отбрасываете?

Скармливание я так понимаю второй этап какой-то? Добавление в аддурилку - это оно?

IndigoMan добавил 29.11.2010 в 08:28

Drafter1:
Вот только этот сайт нормальный, у остальных профили закрыты

Закрыты они я так понимаю через robots.txt ?

IndigoMan добавил 29.11.2010 в 08:35

Drafter1:
Вот только этот сайт нормальный, у остальных профили закрыты

А почему, например, этот не подходит?

robots.txt - там у ничего не закрыто от индексации.

в исходнике HTML я не нашел ни noindex, ни nofollow, каким образом профили закрыты от индексации у них?

1 тиц50, як, домен 2006 г.

2 тиц120 як 2006 г

3 тиц240 2006г (Оо опять)

нашел по одному запросу в яндексе, я правильно понял стратегию?

Да не нужны мне ваши наработки, просто пример дайте и все, или подскажите что сделать, куда копать асфальт.

Спасибо, ваши успехи вдохновляют, можно пример запросов?

Это все конечно хорошо, я и сам смогу допереть со временем как надо собирать такую базу, но я для этого сюда и написал в "вопросы новичков" чтобы мне подсказали и я смог это осуществить не наступая на грабли, а вы теперь говорите что те посты 2008-2009 неактуальны, а что тогда актуально?

Спасибо за DoFollow - новое понятие для меня.

Отлично, но я уверен что есть некоторые хитрости которые помогут меньше времени тратить на поиск подобных сайтов, хотя бы намекните.

Всего: 118