pimandr

Рейтинг
103
Регистрация
25.05.2007
Они говорять это в контракте указано, но если разобраться, то я не подписывал с ними никакого контракта.
Контракт должен быть на бумаге и скреплён подписью.

Но зато видимо у вас есть контракт с подписями, где гугл обязывается выплачивать вам деньги?:)

IBakalov:
На серче была статья, в которой Людкевич акцентировал внимание на некоторых тонкостях проверки, в частности - обязательным условием является наличие сохраненной копии у документа, в вашем примере ее нет.

Косяк, не отследил. Но во втором примере сохраненка есть:

не в индексе

в индексе и с сохраненкой

Так что косяк именно в lang

CookieM:
Спасибо, вроде работает.
Хинт от С.Людкевича с недавней казанской конфы - проще использовать параметр lang:en , чем выискивать страницы с вхождениями этих фраз, которых может и не найтись.

Спасибо за информацию, но "хинт" достаточно кривой.

Пример: запрос договор займа lang:en

На втором месте видим страницу http://www.sibfinance.org/files/rules.pdf которая НПС в индексе

Проверяем искомый запрос на странице и ничего не найдено!

А все почему? Из-за фильтра по языку. Если искать "договор займа lang:en url:http://www.sibfinance.org/files/rules.pdf" то страница снова находится и даже с НПС.

(Кто-то может сказать, что косяк в том, что это pdf но нифига: нет страницы - есть страница)

И заметьте - поиск даже не по Москве. Что это означает? Что ссылочное отключили даже в регионах? :)

Короче, чем глубже изучаю эту теорию, тем больше думаю, что на любой аргумент, подтверждающий эту гипотезу, есть как минимум 2 опровергающих.

PS

спасибо, Seolib, благодаря вам нашел серъезную ошибку в своем скрипте :)

yanus:
А вот наличие ключа в url'е это действительно проблема.

А может быть и не проблема. По крайней мере нашел пару примеров, когда ключ в урле есть, но страница в Мск все равно не находится.

Пример:

купить квартиру в регионе находится, причем даже без приписки о наличии ссылок. Видимо чисто за счет наличия запроса в урле.

Но в Москве этой страницы все равно нет

Вот, наваял тут: http://coolakov.ru/tools/query_checker/

Как всегда, работает лишь с 8 вечера до 8 утра. На проверку одного запроса уходит от 2 до 6 XML, извиняйте.

Алгоритм - такой же, как и тут, слегка модернизированный:

1. Собираем топ100 по запросу вида "фраза << ("error" | "access denied" | "mysql error" | "permission denied")".

2. Выбираем все НПС, проверяем что сохраненка есть и она не быстророботная

3. Проверяем до 5 страниц, которые НПС на наличие в выдаче по Мск по запросу "фраза url:site.ru/page"

И знаете что? Получается совсем немного запросов, по которым ссылки на 100% работают. Чаще всего на 1 подтверждающий урл приходится 3-4 опровергающих.

Например, запрос "каско"

Заранее спасибо за багрепорты и критику.

IBakalov:
SmileP, чтобы BM25 считать нужно знать:

среднюю длину документа в коллекции
IDF слов

Есть идеи откуда можно взять значения?

Баловался я такой ерундой.

Я считал IDF на основе данных о количестве найденных документов по слову и общее количество документов в яндексе. Правда проблемка с переколдовками, но вроде как почти решаемо. Дальше по стандартной формуле BM25. Сравнивал результаты по 1000 слов "мои" веса против тех, что стянуты Трофименко, корелляция 87%. Не фонтан, конечно, но вполне приемлемо.

Длину документа в коллекции вычислить еще проще: спарсить топ100 по нескольким тысячам запросов, спарсить все полученные документы и посчитать медиану или другой усредняющий параметр.

Другой вопрос, что полученные результаты в действительности имеют мало практического применения. По крайней мере лично я до этого не дорос.

SmileP:
если idf1=idf2, то это синоним

Гениально:))) А если масса Васи = масса Пети, значит они братья. Или даже близнецы.

ValD:
Им нужно быть по строго определённым запросам и выглядеть в выдаче именно так, как планировалось.

Вот блин, а я страницы оптимизирую для того чтоб максимальное количество посетителей по нужным запросам переходило.

А оказывается нужно оптимизировать для того, чтоб ссылка в топе выглядела как планировалось.

Заказывал кучку дескрипшенов для сайта.

Работа сделана грамотно, в срок, без ошибок и опечаток.

А я поспамлю своей закладкой. Помимо нумерации выдачи она:

- подсвечивает блок директа

- считает количество морд в топе

- позволяет скопировать урлы из топа списком.

Но да, кликать нужно каждый раз.

Код, который нужно добавить в закладку

javascript:(function(){var%20s=document.createElement('script');s.type='text/javascript';s.src='//coolakov.ru/tools/js/coolbm.js?x='+(Math.random());document.getElementsByTagName('body')[0].appendChild(s)})();void(0);

Ну или отсюда можно просто перетащить на панельку закладок: http://coolakov.ru/tools/bookmarklets.php

Всего: 442