Chewi

Рейтинг
43
Регистрация
22.04.2005
upyrj:
Увы, уже есть пример-исключение. 8(

Если ты про пример с предыдущих страниц, то там вроде второй пассаж попал в анкор-лист, но в ссылочном не учитывается. А если нет, то пример в студию :)

upyrj:


А вообще, еще есть знак многоточия («…», …), который как точка, и всякая другая экзотика (например, «·», · — c пробелом не проверял, без пробела — не делит, подсвечивается как дефис).

Sonja права. Тут, кажется, распределение такое: «блочные теги» делят, «инлайновые» — нет.

По-хорошему, надо бы еще понять, как внутри тега <pre> все происходит.

Ну да, из общеупотребительных я забыл еще про знак ";".

Насчет блочных и инлайновых - мне кажется, это слишком грубое округление. Тегов много, и не факт, что яндексоиды взяли все теги по спецификации HTML и разбросали их на две кучки. Хотя, конечно, интересно было бы проверить.

Sonja:
Разметка - теги, также могут делить пассажи.

Ну да... Я имел в виду все, что относится к "текстовой" части документа, а не к HTML-разметке. если говорить о разметке, то это, навскидку, теги TD, Hx, DIV, P, BR, ну и A, конечно :)

Просмотрел всю ветку. Хочу подытожить:

В ссылочном ранжировании учитывается только первый пассаж текста ссылки.

Являются разделителями (делят текст ссылки на пассажи):

Знаки «.», «!», «?», «:», «-».

Исключения:

1) Когда до и после знака нет пробела – в этом случае части текста, разделенные знаком, являются одним пассажем (это я смог проверить только для знака «.»).

2) Когда следующее предложение после знака и пробела начинается с маленькой буквы – в этом случае части текста, разделенные знаком, являются одним пассажем (это я смог проверить для знаков «.», «:», «-»).

Не являются разделителями (не делят текст ссылки на пассажи):

Знак « » [пробел] в любом количестве.

Знак «,» в любом количестве (независимо от наличия или отсутствия пробелов между запятой и соседними словами).

Я ничего не упустил?

WebTrends - серверный лог-анализатор. Один из самых мощных (если не самый) и богатых по возможностям.

Вот его описания:

http://www.pcmag.com/article2/0,1895,1631831,00.asp

http://www.softline.ru/news.php?id=2812

Демку можно запросить, заполнив форму http://www.webtrends.com/Products/WebTrendsAnalytics8/WebTrendsPackages/PackageMatrix.aspx

А каков вообще алгоритм определения сапплементал?

Угу. Прикольный пример там приведен - http://www.yandex.ru/yandsearch?text=%EC%FB%EB%EE+%EA%F3%EF%E8%F2%FC+ - но имхо не имеет отношения к рассматриваемой проблеме.

Kost:
В Яндексе есть некоторая обработка запроса, при которой ищутся не только слова из запроса. Например вот так будут найдены страницы, на которых написано ".... - это ...". Вот еще пример, вместо "что такое" дает: "аббревиатура расшифровывается".

В нашем случае переколдовка полностью соответствует запросу, ничего нового не добавляется.

Freem:
Заметил сейчас вот что:
http://www.yandex.ru/yandsearch?text=%E1%E8%E7%ED%E5%F1+%EC%EE%E4%E5%EB%FC

При запросе "бизнес модель"на 3ьем месте сайт у которого в сниппете выделяется фраза "бизнес-процессами".

What is this?

Поэкспериментировал с аналогичными запросами - обычно в сохраненной копии для слов, состоящих из двух частей через дефис, по запросу, содержащему только первую часть таких слов, в сохраненной копии подсвечиваются обе части слова, а в сниппете - только одна.

Пример1 :

темно << url="lib.rin.ru/doc/i/98141p.html "

в сниппете обе части не подсвечивается, но в сохраненной копии подсвечиваются обе части слова "темно красный"

Пример2:

(бизнес) << url="helpix.ru/motorola/mpx200/opinion/0025.html"

аналогично

На самом деле стоит даже сказать Яндексу спасибо - многие оптимизаторы зачесались и стали срочно повышать свой уровень знаний о поисковых системах :) Хотя, наверное, выдаю желаемое за действительное - в этом топике не так уж много народу отметилось... Но, кто хотел, тот уже все понял.

А пионэры тоже в накладе не останутся - будут как и раньше юзать непот-сервис Каширина или еще какойнить, после реинкарнации...

Stigmat:
ок. У меня уже пару тысяч сайтов проверено. 😎

Отлично!

Сейчас все напишем свои непот-тестеры, а затем устроим соревнования и массовый забег (прогон по контрольной базе сайтов с публикацией результатов), можно даже тотализатор устроить 😂

Эх, бедные Я-овцы - всего-то хотели снизить нагрузку на свои сервера...🙄

Всего: 129