Chewi

Рейтинг
43
Регистрация
22.04.2005
Stigmat:
Я практически так и делаю.
Задаю запрос (анкор) в кавычках.
Если больше одной страницы результата поиска, то большая вероятность, что ссылка не уникальная. И скрипт не может определит непот.
Скрипт сохраненные копии не смотрит. 🙄 Практика показала, что если есть в снипете анкор, и всего одна страница результата выдачи, то это скорее всего, и есть ссылка на акцептор.

Накопите побольше статистики. В течение пары дней допишем свой скрипт, а потом сравним результаты - посмотрим кто кого 🚬

Parkan:
Это я к тому, что "неправильно" написанное слово может обрабатываться по-другому. Не проверяли ?

Во-первых, я думаю, Яндексу все равно, правильно написано слово или с ошибкой - он подсчитает вес "ошибочного" термина и отранжирует его по тому же алгоритму (только вес "ошибочного" термина, естественно, будет меньше).

Во-вторых, в данном примере в обоих запросах употреблялся один и тот же термин.

В-третих, по моему опыту спец. обработки запросов с ошибками нет (за исключением того, что Я предлагает "исправить ошибку").

MiRaj:
корректность данного оператора не раз поднималась различными исследователями.

Тема эта поднималась, но обычно в контексте невразумительного "наверное, там какой-то другой алгоритм". Даже предположений, чем и как он может отличаться, я не помню.

Parkan:
стеллажи в двумя "л" пишутся...

Спасибо, моя знать русская языка🚬

Если время сегодня будет, опишу один интересный эксперимент, в ходе которого я и наткнулся на данный пример. Может, это подстегнет обсуждение...

Редько Владимир:
Не догнал я цель Вашего исследования.

Цель исследования - понять, можно ли сейчас использовать оператор "|" для изучения алгоритмов ранжирования Я.

Редько Владимир:
Не догнал я цель Вашего исследования.

У Миныча выводилась попытка анализа ранжирования в зависимости от релевантности.
В Вашем случае подается комманда Яндексу найти указанное слово в указанных сайтах...

и результат затем будет отранжирован по релевантности. ИМХО Вы не невнимательно читали о методике Миныча - именно на такого рода запросах она и была построена. За исключением того, что у него запросы были ортогональными, а у меня, как видите, нет, потому что в данном примере я не сравниваю выдачу по методике Миныча, а пытаюсь выявить особенности оператора "|".

upyrj:
Я бы подумал в сторону того, что в первом случае мы имеем дело в некотором смысле с однословником, а во втором — с многословником. Типа (до) Родео и все такое. 8/

Кроме того, сравните запросы «стелажи» и «стелажи | стелажи»: абсолютно та же история.

Не думаю. Я такого рода примеры замечал и до Родео. Хотя, конечно, интересно, считается ли "запрос1 | запрос2" многословником :) Но думаю, что нет.

По поводу «стелажи» и «стелажи | стелажи» тоже не совсем все чисто...

Если взять два запроса:

1*. ( стелажи | стелажи) << (url="www.forma-com.ru" | url="www.nasklad.ru")

2*. ( стелажи << url="www.forma-com.ru") | ( стелажи << url="www.nasklad.ru")

Результат одинаков - на первом месте www.nasklad.ru. Но если начнем понижать вес слова стелажи, то увидим, что и там, и там будет ступенька (такое значение веса слова "стелажи", при котором сайты в выдаче поменяются местами), причем это значение веса различно для запросов 1* и 2* - то есть алгоритмы при ранжировании по запросам 1* и 2* тоже различаются! Меня, собсна, больше интересует 2*, а не 1* :)

Sayros:


А по теме - имхо тоже можно объяснить особенностью оператора: может он в первом случае формирует массив из страниц внутри урла. обладающий несколько иными свойствами, нежели при выборке и сравнению между страницами внутри урлов отдельно.

Разница-то ведь формально только в структуре запроса? Остальные параметры не меняются (если это так)? Тогда и причину надо искать в особенностях оператора, который делает результат с и без раскрытия скобок разным.

И еще обязательно надо помониторить - сохранится ли такое через 1-2-3 апа.

Будем думать :)

Sayros:

Ночью пробовал повторить то же самое с другими ключевиками, другими сайтами - ничего такого, с чем можно было бы однозначно связать наблюдаемое "явление", не нашел:(

Чтоб такой "чистый" пример найти, нужно много сайтов проанализировать. Но я, собсна, специально и не искал его, он сам вылез при другом эксперименте...

Неужели никому не интересно?

Или добавить нечего? Не верю!) Делитесь своими соображениями и примерами, давайте обсуждать их!

Alex_L:
И я что ли идейку подкину =)
Парсер лежит тут (сыроват но как идея сойдет)
Идея проста - вводите запрос он вытаскивает оттуда страницы которые, ссылаются на указанный домен. Все же лучще чем ничего! Хотя можно и проще ;)

Так не интересно, в исходниках выкладывай! ;)

dantess:


Можно еще предварительно вот такой запрос сделать - в большом кол-ве случаев анкор уже тут окажется неуникальным.

Ну и т.д

Такой вариант подходит только для тех случае, когда заранее известно, что беков по запросу много (настолько много, что найдется и запрашиваемый таким образом вариант:)), то есть, скорее всего, для популярных, высокочастотоных, однословных запросов. Но и так понятно, что вероятность найти уникальный бек с такого рода анкором близка к нулю.

Таким образом, на текщий момент алгоритм определения уникальности ссылки с помощью Я выглядит так:

1. Получить от Я выдачу по интересующему запросу (тому, который содержится в анкоре проверяемой ссылки).

2. Искать в полученном списке документов страницу, которая не является исходной страницей-донором, ссылается на акцептор, и анкор ссылки с которой идентичен анкору ссылки донора.

3. Если результат поиска равен нулю, то ссылка уникальна. Больше нуля - ссылка не уникальна.

Тимон:
Хм-м, вот с "прямого эфира" взял запрос - ("гидроабразивная резка металла"<<url="flowrussia.ru")|("гидроабразивная резка металла"<<url="www.cardir.ru/slovar/auto_18.php") - видимо проверяют на индексацию ссылку на сайт flowrussia.ru. Хотя получается, судя по выдаче, ссылка проиндексилась на доноре, но не учлась для акцептора - т.к. в сниппете нет текста ссылки...

Вообще-то по сниппету видно упоминание поискового запроса в тексте страницы, поэтому на основании полученных таким запросом данных говорить, учлась она или нет - неверно.

По теме:

палю тему ;) по непоту

думаю, алгоритм проверки ссылки на непот должен быть такой:

1. проверяем проиндексенность ссылки на доноре и акцепторе (как именно, уточнять не буду - не суть важно)

2. если есть подозрение, что ссылка не в непоте или, наоборот, в непоте, в соответствии со старой методикой определения непота в таком случае необходимо проверять ссылку на уникальность

3. для проверки на уникальность собираем как можно больше беков акцептора по всем доступным источникам (другие п.с.), отбираем из них только те, которые проиндексены в Я

4. производим анализ полученного массива беков с целью определить, является ли проверяемая ссылка уникальной

Самое интересное, что если все оптимизаторы начнут пользоваться данным методом, то нагрузка на сервера Я возрастет многократно. Так что, если одной из целей сокрытия операторов link и anchor было снизить нагрузку на сервера, то результат может быть прямо противоположный.

Почему же? Через задницу (извиняюсь), но проверишь уникальность, стоит включить моск на пару процентов больше обычного и картина становится намного радостнее

Я придумал способ, но он уж больно трудоемкий...

ИНтересно, мы об одном и том же говорим или нет? :)

WEB_Spb:
Chewi, посмотрите 12-14 посты этого топика.

Не понял, к чему ссылка на те посты - решения проблемы там не предлагалось...

Я в курсе, что яндекс непот не показывал, но определять-то мы его могли как раз используя отключенные нынче операторы. Или эта проблема нонче уже решена? ;)

И в третьих (имхо в самых главных), полученные проиндексированные в Я беки могут быть под непотом, который теперь сложно определить (бек на уникальность теперь не проверишь с помощью яндекса...).

Всего: 129