kotofeich

kotofeich
Рейтинг
28
Регистрация
25.03.2009
Должность
Web-coder

Хорошо. Привожу статистику к размышлению, полученную за вчерашний ап выдачи.

Около недели назад на одну площадку было закуплено 1000 абсолютно различных ссылок без разбора.

Я ежедневно посылаю запрос к бирже, получаю массив купленных ссылок, и проверяю их на YAL и строю графики (конечно скриптом).

Мой скрипт определил для всех ссылок трастовость. В ап в индексе оказались 158 ссылок.

Согласно статистике - 78% этих ссылок имеют среднюю трастовость, 12% ссылок низкую трастовость, 2% высокую, а остльные ссылки оказались ГС.

MASTAKILLA:
На некоторых сайтах контент достаточно часто обновляется, они в яке. :) Есть еще предложения?

А почему ты сказал что есть рандомность? Некоторые сайты определились как СДЛ?

MASTAKILLA:
Конечно стал бы. Исходящих нету, бизнес тематика, некоторые сайты в ЯКЕ, беки хорошие.
Почему бы не брать? Почему это ГС считается?

Знал бы я ответ на твой вопрос=) Могу предположить, что сайты хоть и старые, и возможно плотно сидят в выдаче, но давненько не обновлялся контент на сайте

MASTAKILLA:
Некоторые сайты, старые, ссылок и естественных хватает, так что не только сапой завалены =)

А какое это отношение к делу имеет?:) Вы бы тогда сразу эти факторы в скрипте учли.
Все бы супер площадки забанили, отдельный список с сообщением этот сайт не анализируется.

Для сайтов которые с ссылочной массой, напишите, такие сайты не анализируются.

Ну и так далее, исключая все что может опровергать правоту пользователей вашего скрипта. ;)

Еще раз говорю, что сайт анализирует ваши сайты на "любовь" яндекса, то есть в моем понимании это сколько времени пауки яндекса проводят на сайте, и индексируют его. Скрипту без разницы, сколько у вас сапо ссылок на нем, и сколько на него ссылается. У меня есть сайт, на котором продано 1200 ссылок, и он определился как СДЛ с высокой трастовостью.

Я не знаю на основе каких факторов робот проводит больше времени.

Оцените свои сайты в качестве доноров. Что бы вы сказали? Стали бы вы брать ссылки со своего сайта?

MASTAKILLA:
Какой то рандом получается... у меня не мега порталы, и не ГС точно сайты клиентов, почти все УГ=) с нулевой трастовостью )) Может и правда так?! %))))))

А ты много над ними работаешь, или только ссылочной массой выдачу качаешь?:)

nskebar:
А что Яндекс палит кроно-грабберы? :)

Ну в бан у меня еще ни один не ушел, но чувствую пассажы сплогов ему не так нравятся. Индексирует он их не так быстро как хотелось бы.

Можешь прикрутить прокси к скрипту? Тогда нет необходимости в зеркалах и т.п

Нет. Где я найду столько проксиков?)

Вообщем поднял зеркало на локальном серваке. Буду менять ip каждый час и писать тут.

Сейчас можете тестировать по ip http://94.41.45.253.

P.S. У сервака проблемы с кодировками, и поэтому написал все транслитом. Да, и скорость низкая (64кб/с). Поэтому терпите=)

Leon1010:
((( а еще только 1:22
Дайте потестить то =)

В обед создам зеркало для тестов. У меня уже пол четвертого:)

1. Результаты поиска почему-то в Уникоде открываются. Приходится кодировку менять. Очень неудобно
2. Когда надо перейти к следующему сайту - перекидывает на страничку: http://linkfeedator.ru/sdl/

Наши проекты определил в основном как СДЛ, а клиентские в основном как ГС.

1,2) Исправил.

Возможно над своими проектами работаете больше чем над клиентскими:)

Я так понял трастовое окно дежнева - это священный <input> ТС )) по чем вы планируете продавать сеё чудо?

О продажах пока даже мысли не было. Это лишь экспериментальный скрипт.

kotofeich, ваш скрипт выдает почти полный рандом. Сожалею. Вердикт - УГ.

Пример рандома в студию. Не учитывйте мега-популярные порталы, к которым у яндекса особое отношение.

P.S. Народ яро бомбил скрипт, и колличество запросов у меня вновь закончилось (было 1000 запросов). Скрипт вновь начнет работать в 00:00 по московскому времени.

petruxa:
Слушай, ТС, а вообще-то - респект тебе) Кому как, а мне сервис может быть очень даже небесполезен, так как других способов определять "любовь" бота к площадке я не знаю.

На Нетпромотере как раз Садовский отвечал по поводу XML и сказал, что по крайней мере в ближайшие несколько месяцев отключать его не планируется.

Спасибо. Я рад, что еще один человек понял мои цели.

Я читал про нетпромоутер только некоторые выводы, насчет анадыря и апдейтов, но ни слова не видел про xml.

Очень охото увидеть подробности.

Учтите, что на ГС может быть залит большой архив статей, которые будут автоматически публиковаться скажем по 1-2-й штуке в день в течении полугода, для имитации естественного добавления. Таким образом робот может там находиться достаточно часто, что не делает ГС СДЛом.

Не факт, что робот будет индексировать статьи так часто. А если статьи будут уник, которые яндекс будет бешенно индексировать, то это уже полноценный СДЛ-донор с моей точки зрения. Иначе бы все сплоги с кроном-граббером мой скрипт определил как СДЛ-сайты. Но это не так.

kotofeich добавил 26.03.2009 в 00:19

Roman Sergeevich:
Проверил один сайт с неоригинальным контентом, взятым с других сайтов.
Анализируемый сайт: http://autosovetov.net
Яндекс принял сайт за СДЛ. Трастовость просто запредельная

ХЗ. Может ему ваша перелинковка понравилась. Может работаете над сайтом.

P.S. Сервис снова работает. Еще 1000 запросов. Тестируем дальше.

noosfera:
на нетпромоутере вроде говорили, что в ближайшее время xml must die

Кинь ссылку если есть. На самом нетпромоутере я не был, но аргументы мне очень интересно послушать.

kotofeich добавил 25.03.2009 в 23:19

Malcolm:
По моим получилось с точностью до наоборот. ГС под сапу с 80% копипаста и тысячей проданных ссылок, определился как "высокотрастовый", а трехлетний сайтик в ЯК и DMOZ оказался средней паршивости 🚬

Я не смогу сказать почему скрипт так определил. Но хочу спросить тебя, есть ли хоть какие-то предположения, почему на твоем ГС сайте робот яндекса сидит больше, чем на на старом сайте?

Всего: 162