Но зато видимо у вас есть контракт с подписями, где гугл обязывается выплачивать вам деньги?:)
Косяк, не отследил. Но во втором примере сохраненка есть:
не в индексе
в индексе и с сохраненкой
Так что косяк именно в lang
Спасибо за информацию, но "хинт" достаточно кривой.
Пример: запрос договор займа lang:en
На втором месте видим страницу http://www.sibfinance.org/files/rules.pdf которая НПС в индексе
Проверяем искомый запрос на странице и ничего не найдено!
А все почему? Из-за фильтра по языку. Если искать "договор займа lang:en url:http://www.sibfinance.org/files/rules.pdf" то страница снова находится и даже с НПС.
(Кто-то может сказать, что косяк в том, что это pdf но нифига: нет страницы - есть страница)
И заметьте - поиск даже не по Москве. Что это означает? Что ссылочное отключили даже в регионах? :)
Короче, чем глубже изучаю эту теорию, тем больше думаю, что на любой аргумент, подтверждающий эту гипотезу, есть как минимум 2 опровергающих.
PS
спасибо, Seolib, благодаря вам нашел серъезную ошибку в своем скрипте :)
А может быть и не проблема. По крайней мере нашел пару примеров, когда ключ в урле есть, но страница в Мск все равно не находится.
Пример:
купить квартиру в регионе находится, причем даже без приписки о наличии ссылок. Видимо чисто за счет наличия запроса в урле.
Но в Москве этой страницы все равно нет
Вот, наваял тут: http://coolakov.ru/tools/query_checker/
Как всегда, работает лишь с 8 вечера до 8 утра. На проверку одного запроса уходит от 2 до 6 XML, извиняйте.
Алгоритм - такой же, как и тут, слегка модернизированный:
1. Собираем топ100 по запросу вида "фраза << ("error" | "access denied" | "mysql error" | "permission denied")".
2. Выбираем все НПС, проверяем что сохраненка есть и она не быстророботная
3. Проверяем до 5 страниц, которые НПС на наличие в выдаче по Мск по запросу "фраза url:site.ru/page"
И знаете что? Получается совсем немного запросов, по которым ссылки на 100% работают. Чаще всего на 1 подтверждающий урл приходится 3-4 опровергающих.
Например, запрос "каско"
Заранее спасибо за багрепорты и критику.
Баловался я такой ерундой.
Я считал IDF на основе данных о количестве найденных документов по слову и общее количество документов в яндексе. Правда проблемка с переколдовками, но вроде как почти решаемо. Дальше по стандартной формуле BM25. Сравнивал результаты по 1000 слов "мои" веса против тех, что стянуты Трофименко, корелляция 87%. Не фонтан, конечно, но вполне приемлемо.
Длину документа в коллекции вычислить еще проще: спарсить топ100 по нескольким тысячам запросов, спарсить все полученные документы и посчитать медиану или другой усредняющий параметр.
Другой вопрос, что полученные результаты в действительности имеют мало практического применения. По крайней мере лично я до этого не дорос.
Гениально:))) А если масса Васи = масса Пети, значит они братья. Или даже близнецы.
Вот блин, а я страницы оптимизирую для того чтоб максимальное количество посетителей по нужным запросам переходило.
А оказывается нужно оптимизировать для того, чтоб ссылка в топе выглядела как планировалось.
Заказывал кучку дескрипшенов для сайта.
Работа сделана грамотно, в срок, без ошибок и опечаток.
http://yandex.ru/yandsearch?text=сервис позиции сайта
А я поспамлю своей закладкой. Помимо нумерации выдачи она:
- подсвечивает блок директа
- считает количество морд в топе
- позволяет скопировать урлы из топа списком.
Но да, кликать нужно каждый раз.
Код, который нужно добавить в закладку
javascript:(function(){var%20s=document.createElement('script');s.type='text/javascript';s.src='//coolakov.ru/tools/js/coolbm.js?x='+(Math.random());document.getElementsByTagName('body')[0].appendChild(s)})();void(0);
Ну или отсюда можно просто перетащить на панельку закладок: http://coolakov.ru/tools/bookmarklets.php