kotofeich

kotofeich
Рейтинг
28
Регистрация
25.03.2009
Должность
Web-coder
Malcolm:
Единственный параметр в выдаче xml, связанный хоть как-то с датой, показывает время последней модификации страницы, которое отдал сервер во время захода робота.

Часть серверов не отдают это время вообще и в выдаче параметр просто отсутствует. Для сайтов со статическим контентом там содержится время создания html-страницы, даже если она три года назад сделана. Поэтому судить о времени последнего посещения роботом по этой выдаче нельзя в принципе.

рекомендую получше поизучать язык запросов яндекса и забить на тупой и не однозначный параметр modtime.

p.s. я долго пытался анализировать этот параметр, но результаты были просто никакие.

Тема состоит не в том как работает мой скрипт, а насколько точно он работает.

Asklepiy:
Сервис - УГ. Все сайты, что я проверил оказалсь ГСами. А это были хорошие и очень хоршие площадки.

ТС, вы бы сначала скрипт проверили на... кошках, тогда бы не пришлось клона создавать ;)

Возможно вы проверяли после того как у меня закончились 1000 запросов к яндексу. Через два часа открою, попробуйте заново.

А кто Вам сказал, что это показатель трастовости? Это показатель частоты обновления, в какой то мере.

Никто вам не скажет, что такое трастовость. Я лишь предположил принять нахождение робота яндекса на сайте за трастовость.

Ну что вы накинулись на ТС. Конечно о трастовости тут речи нет, хотя что то в этом есть.

А ведь это можно использовать - например отобрать площадки в sape - чтобы быстро загнать робота яши на новый сайт..

Спасибо. В этом и была моя цель. Только я работаю как оптимизатор с linkfeed, так как там есть нормальный api. (просьба не обсуждать в этом топике биржы. Это сюда совсем не относится.)

проверил свои. Тиц у обоих ноль.

тот который я считаю СДЛ, он посчитал пародией! Возможно!
тот который я считаю ГС, он посчитал ГС!

Согласен на 100%

можно чутка приоткрыть алгоритм расчета?

Тоже спасибо, что алгоритм подтвердил свою точность. Суть алгоритма я раскрыл - это выдача яндекса и время обращения к страницам сайта.

Stripe:
Ну Dmoz и Google он конечно в ГС определил :))) Тут все верно конечно :)))

Проверь сам когда последний раз их индексировал яндекс тут для google и тут для dmoz. У яндекса даже нет даты последнего обращения, и он знает лишь об одной странице. Как ты думаешь какого мнения он об этих сайтах?

Они ему по-барабану. Тестируйте лучше сайты, с которых покупаете ссылки, или свои личные сайты.

nskebar:
Четкое описание скрипта:)

Я сказал, что анализирую время, которое паук-яндекса проводит на сайте, и на основе этого составляю его отношение к сайту.

nskebar:
А где там сказано о "трастовости", "СДЛости" или "ГСайтости"?
Но скриптик посмешил :)

До следующего дня скрипт для всех сайтов будет писать, что они ГС.

А ты думаешь яндекс прямо напишет в выдаче что этот сайт СДЛ, а этот ГС? Бред же полный.

У меня закончилось колличество запросов в сутки. Ждите следующего дня для анализа.

Просто скрипт рандомно выбирает один из ответов, вот и весь прикол

Приведи пример рандомности.


Вопрос ТСу на засыпку: скрипт определяет "трастовость" сайта как чего?? Как донора? Как акцептора? Это ведь не совсем одно и то же (хотя связь наверное и есть). Что вы лично понимаете под "трастовостью"?? (опустим, что это может не совпадать с мнением Яндекса).

При создании скрипта меня интересовало более правильно выбрать доноров для покупки ссылок. Под трастовостью понимаю интерес яндекса к конкретному сайту.

Анализируемый сайт: http://microsoft.ru
По мнению яндекса это ГС с нулевой трастовостью.

Еще раз говорю, бесполезно проверять подобные сайты со спец фильтрами, и особым отношением. Скрипт предназначается для обычных сайтов.

kotofeich добавил 25.03.2009 в 21:35

DonHenaro:
Не удивительно - ведь это редирект. А ком сайт очень высоко оценивает.

В принципе хороший скрипт! ТС респект!

Спасибо.

P.S. Я не смогу дать ответы на все вопросы. Но если скрипт обосрал ваши сайты, то это не значит что скрипт виноват. Я лишь анализирую xml выдачу яндекса.

Народ, если охото поржать сходите в цирк в конце концов. Если не говорите по делу, то лучше молчите. Мне более важен анализ, чем поздравления с первым апреля.

il4:
ну тогда я позволю себе усомниться в правильности скрипта:
1. робот бывает на сайте на столько часто, на сколько быстро на нем меняется контент, но площадки с неизменяемым (малоизменяемым) контентом тоже могуть быть СДЛ, причем ооочень часто

2. робот бывает чаще на сайтах с большим количеством информации (как вывод из п.1), неужто хоумпейджи или т.п. и маленькие (до 1000 документов) сайты по мнению Вашего скрипта обречены быть ГС по определению?

1,2) У меня есть площадки с малоизменяемым контентом (два поста в месяц), и малым числом страниц но на них постоянно сидит паук яндекса. Чем это можно объяснить?

я так понял - как можно больше уник текста + всякие фентифлюшки на странице, типа поиска, календарика, опросника и т.д. - показывает что сайт СДЛ.

хз. Я не могу сказать почему робот яндекса зависает больше на таких сайтах чем на других.

Мсье знает алгоритм траста? Откуда ты знаешь как Яндекс относится к моему сайту? Только по своему воспаленному воображению?

ПС. Комментарии по тем сайтам из запроса "окна" не дашь? Как то ты их ловко пропустил...

Нет не знаю. Это лишь теория. А теорию надо проверять. Прошу не судить строго, но я пошел сюда, так как знаю что тут много народу заинтересованных в подобном. Я не беру ни за что денег, и никак ничто не пиарю (иначе бы хоть дизигн сделал). Просто тестю.

Насчет окон - сайт очень редко обновляется. Да он плотно сидит в выдаче, но обновлений ноль, и возможно скажется в ближайшем будущем.

Анализируемый сайт: http://sape.ru
По мнению яндекса это ГС с нулевой трастовостью.
Проверить другой сайт

Анализируемый сайт: http://wikipedia.org/
По мнению яндекса это ГС с нулевой трастовостью.

Анализируемый сайт: http://torrents.ru
По мнению яндекса это ГС с нулевой трастовостью.

Анализируемый сайт: http://vkontakte.ru
Яндекс принял сайт за пародию на СДЛ, с мизерной трастовостью. (но все-таки СДЛ!!!)

Бесполезно анализировать сайты, на которых стоят специальные фильтры. Цель скрипта- помочь выбрать сайты, на которых купить ссылки.

простой пиар сайта своего

Это был бы самый бредовый пиар, который только можно придумать.

Всего: 162