Комментарии - nik_kent - Профиль вебмастера - Форум об интернет-маркетинге

Определение релевантных пассажей для запросов Яндексом.

30 ноября 2011, 09:22

joost:
1. если в запросе несколько слов (например три) и одно из них не проходит кворум, то запрос Яндекс обрабатывает уже двухсловный + еще переколдовка?
2. кворум - это тест на значимость слов в запросе? например "где можно купить принтер" после кворума будет "купить принтер" ?

Вы действительно не понимаете основ и читать вдобавок не умеете. Кворум проходят не слова, а документы. Кворума в переколдовке запроса нет. Кворум - это отбор документов, которые в дальнейшем будут ранжироваться по запросу.

Если запрос "где можно купить принтер", а в документе написано "купить принтер", то такой документ пройдет кворум по этому запросу, потому что слова "купить" и "принтер" имеют значительный вес, а "где" и "можно" - незначительный.

Если в документе будет "где можно купить", то документ кворум не пройдет, так как "принтер" имеет значительный вес - самое значимое слово в данном запросе.

А вот веса словам задаются при переколдовке запроса.

редиректы, или как собрать вес ссылок с алиасов

30 ноября 2011, 09:13

pr-light:
по факту,.
на около 150 трастовых сайтах с улетными тицами стоит по ссылке на два разных проекта (одна тематика), обе в индексе, ссылы похожи по всем свойствам
во первых - на первый идет неплохо 100тица, на второй идет ноль (стоят года пол)..
во вторых - ну блина.. может я и не прав конечно, но продвигаем у меня все-таки один домен, а тот на который ссылы стоят с трастов - другой, и они без склейки были..
ну и так то в yaca тоже не основной домен(

Сейчас Яндекс лучше клеит 301-м, чем раньше, однако наиболее верный способ Вам описали во втором посте. Добавлю только, что на момент склейки в Яндексе с помощью директивы Host в robots.txt сайты должны быть полностью идентичны. Проще всего это делается с помощью ПУ хостингом, где один сайт прописывается алиасом к другому.

chiki5uki:
по какой технологии проверяли передачу веса?

Для того, чтобы проверить учитываются ли ссылки, стоящие на зеркало, нужно найти ссылку с уникальным анкором и ввести анкор в кавычках в Яндекс. Если находится основной сайт по НПС, то ссылки, стоящие на зеркало учитываются при ранжировании основного сайта. Технология достаточно стара и всем известна.

pr-light:
блина, это вообще опасно?

Нет.

Определение релевантных пассажей для запросов Яндексом.

30 ноября 2011, 06:46

joost:
а как же правильно?

Для кого правильно?

Вы думаете в алгоритме Яндекса встречается такое понятие, как "релевантный пассаж"?

Откройте доклад Яндекса на РОМИП 2006 и увидите, что показатель релевантности документа запросу

Score = W(single) + W(pair) + k1*W(AllWords) + k2*W(Phrase) + k3*W(HalfPhrase) + ...

Под Ваше понятие "релевантный пассаж" здесь больше всего подходит W(HalfPhrase) - наличие многих слов запроса в одном предложении. Под наличием многих слов здесь вероятно и подразумевается наличие достаточного количества слов из запроса для прохождения предложением кворума.

Почему Яндекс при индексировании сайта добавляет ".html" в конце адресов странц сайта

25 ноября 2011, 08:38

miramida_com_ua:
Почему Яндекс при индексировании сайта добавляет ".html" в конце адресов странц сайта

А как Вы смотрите? Я не вижу такого.

Подскажите по robots.txt

23 ноября 2011, 07:53

Оринаих:
Можно ещё спросить: не встречала ранее такой директивы, с двумя звёздочками. Что это означает? —
Disallow: */page/*

Означает не индексировать страницы, в URL которых содержится "/page/". Disallow: */page/ - то же самое.

Disallow: /page/* и Disallow: /page/ - не индексировать страницы, начинающиеся с "/page/".

Подскажите по robots.txt

23 ноября 2011, 07:30

Людмила Лисаева:
может просто надо убрать действительно первую звездочку

У Вас итак уже есть без первой звездочки:

Людмила Лисаева:
Disallow: /page/*
Disallow: */page/*

Людмила Лисаева:
который есть сейчас для всех, тоже стоит оставить?

Конечно.

Людмила Лисаева:
Mediapartners-Google - написан в точности как на гугле в адсенсе рекомендовано... Если его продолжить, будет ли это правильно?

Я бы сделал отдельный именно для Googlebot, а насчет Mediapartners-Google я ничего не знаю.

Подскажите по robots.txt

23 ноября 2011, 06:59

Людмила Лисаева:
Так если без звездочек, то мне и все остальное надо делать без звездочек?
А как эти звездочки читаются правильно?

Звездочка в конце правила всегда подразумевается, так что ее можно ставить, можно не ставить - никакой разницы.

Можете дать сайт посмотреть?

Может дело в первом блоке - Mediapartners-Google. Хотя в таком случае была бы проблема и с другими страницами. Может стоит сделать отдельный блок для GoogleBot'a?

Ну и как последний вариант - на эти страницы стоят ссылки, поэтому google плюет на запрет в robots.txt.

Подскажите по robots.txt

23 ноября 2011, 05:24

Officer:
Напишите просто так без звездочек:
Disallow: /page/

Это тоже самое, что и:

Людмила Лисаева:
Disallow: /page/*

Может просто не успели еще вылететь?

Только с page такая проблема или с другими тоже?

Веб-студия в малом городе.

23 ноября 2011, 03:51

Rastfart:
предпренемателей

Rastfart:
потетнцыальных

Rastfart:
помоч

Rastfart:
свединиям

Rastfart:
пришол

И ладно, если бы это только на форуме было, но ведь на сайте-то тоже самое:

элси-спасск.рф/veb-studiya.html:
ДЕШЕГО

элси-спасск.рф/veb-studiya.html:
не заменимую

элси-спасск.рф/veb-studiya.html:
мир !

Я не говорю уже о смысловой составляющей текста вроде:

элси-спасск.рф:
обучение и создание Сайта

И, кстати, по русскому языку у меня в школе всего 4-ка была :)

Подскажите по роботс.тхт - яндекс все равно пишет, что главная страница исключена...

17 ноября 2011, 10:49

User-Agent: *

Disallow:

Host: (www.)site.ru

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

nik_kent