ApokalipsYs

ApokalipsYs
Рейтинг
106
Регистрация
27.04.2006
umklaidet:
Я понимаю, что все это давно известно. Но всю плачевность ситуации я не понимал, пока не получил эти данные. Во вложении запросы с ценами из директа.

Спасибо за исследование.

G00DMAN:
ApokalipsYs, Вы слишком много всего намешали в кучу. И верного, и спорного и не верного. Как-то влом все это разгребать подробно, да и зачем? Что Вы хотите в итоге получить? Все простые факторы, влияющие на ранжирование? А Вы разве не в курсе, что корреляция каждого из них с выдачей (тупо посчитанная по большому числу топ-10) очень низкая? Ну, кроме "артефактов". :)

Можно заметить, что из значимых для ранжирования факторов:
  • есть факторы пары (запрос, документ), по которым происходит обучение функции ранжирования. Далеко не все из них такие простые, как у Вас, многие - это достаточно сложные формулы.
  • теоретически есть факторы, слабо коррелирующие с группой, указанной выше, но имеющие не плохую корреляцию с ранжированием
  • есть факторы, которые не участвуют в функции ранжирования, но участвуют в фильтрах, накладывающихся на выдачу после вычисления релевантности
  • есть еще какие-нибудь факторы


Кроме факторов для ранжирования есть еще факторы для индексирования, те же АГС, аффилиаты и т.д.

Это все разные группы и мешать их в кучу не стоит.

Спасибо за комментарий.

Цели вычислить формулу релевантности у меня нет.

Есть цели - развеять мифы о значимости определенных факторов, услышать опыт людей как по факторам ранжирования, так и по связкам, а также особенностям влиянии факторов при наложении друг на друга. И это я хочу сформулировать языком оптимизаторов, а не разработчиков поиска. Если вам будет не лень писать, буду рад услышать ваше мнение и ваш опыт по тем пунктам, которые вы указали, вижу что вам есть чем поделиться.

ApokalipsYs добавил 30.06.2010 в 17:40

aalexeev:
1. нет разбиения на link value factors, on-page factors, relevance factors (млин не знаю как это порусски называется по нормальному)) и т.п. очень сложно во всем копаться

2.не рассмотрены общеизвестные значимые факторы ранжирования, в т.ч. ВИЦ страницы донора, SEOin донора, количество ссылок со страницы донора, УВ страницы донора, объем контента на странице донора и т.п. Вообще нет группы факторов-фильтров (ты спамный, ты последний).

Попробуете написать об этом?

// "Количество контента на странице" и "Уровень вложенности страницы-донора" в 24 пункте

datot:
9. Сайт
i. Количество страниц

Показать 1,3 и 6 стр. сайты, которые имеют траф до 500 чел и по ВЧ ВК стоят в топе?
Нет влияние от объема сайта.

Действительно, в узких тематиках сайт может на 2-3 страницах уместить всю информацию, необходимую посетителю. Но почему вы думаете, что сайт с 3-мя предложениями по аренде квартир будет отвечать запросу пользователя "аренда квартир в москве" и может конкурировать с порталами, имеющими десятки, а то и сотни тысяч страниц с предложениями? Даже если такой сайт попадет в топ по такому запросу, зачем он там нужен?

datot:
2. Количество страниц, содержащих конкретное ключевое слово Предположим таких страниц из 40 000 - 10 000 страниц содержат ключевое слово. И что дальше.
Могу показать сайт, которые по данному ключу в глубоком колодце.

Что вполне логично, если по другим факторам сайт проигрывает конкурентам.

datot:
ii. Дата первичного захода робота ПС на сайт - А это причем
Есть сайт, которые зареген домен 25 декабря.
Сайт включен 30 декабря
В топе по ключу первый ап, кажется 4 января.
Есть сайт, который робот скушал в тот же день, как выложили, уже полгода - он больше роботу не нужен.

Есть мнение, что возраст сайта считается поисковой системой не с даты регистрации домена, а с момента первой индексации сайта поисковым роботом.

datot:
iii. Тип сайта
1. Информационный ресурс
2. Коммерческий ресурс

Расшифруйте, что здесь вы имели ввиду

Речь, о том, что дает ресурс своим посетителям: возможность получить информацию или совершить покупку.

datot:
iv. Наличие дубликатов страниц на сайте
v. Массовое дублирование контента

Вы про свои сайты - так они еще не в бане?

Не понял, о чём вы.

Я перечислял возможные факторы, которые могут влиять на ранжирование, как в положительную, так и в отрицательную сторону. Вы решили, что я предлагаю дублировать информацию на сайте? :)

ApokalipsYs добавил 30.06.2010 в 15:14

panzergto:


вот кстати из другой темы:

Вдогонку: продвижение по НЧ - не панацея. Все слышали истории про «давайте продвигать дешевые и эффективные НЧ!». В ряде тематик трафикогенерирующими являются высокочастотные запросы, низкочастотники не работают, хотя конкуренция по ним не уступает высокочастотникам. НЧ продвигают все, точно также, как и ВЧ. Не стоит забывать и о том, что стоимость одного посетителя при продвижении группы низкочастотных слов будет значительно выше, чем при продвижении по всем запросам тематики.

абсолюютно не согласен :)
во всех тематиках где работаю есть куча нч, о которых никто не вкурсе, потому как конкуренция нулевая :), естесственно некоторые из них по статистике 0 раз в месяц, некоторые 1 и т.д, в статистике сами по себе не отображаются, приходится иногда сидеть угадывать какие запросы могут вообще задаваться, но зато потом это реальные клиенты :)

В каких тематиках вы работаете?

ApokalipsYs добавил 30.06.2010 в 15:21

savage:

datot:
Каким боком это влияет? У меня есть сайт, примерно 620 000 стр. Но по ключу, я далеко не в топе.

Ну это понятно, видимо просто не релевантна страница ключу, и нет внешней составляющей. А так вообще, чем больше страниц у сайта, и чем больше страниц у сайта релевантных ключу, вполне может быть одним из факторов ранжирования. Одно дело, когда сайт - 10 страниц и ключу релевантна(по теме) только одна страница, другое - у сайта 10000 страниц и ключ встречается на 5000 из них.
Лажовый запрос.

От себя добавлю, что нужно понимать разницу между

- 5000 страниц с ключевым словом в блоке подвала или меню, которое дублируется по всему сайту

- 5000 страниц с разным контентом, содержащим то же ключевое слово

datot:
Есть частичное влияние написание домена или части его при ранжировании при прочих равных условиях. Если взять условно наличия 1001 факторов, влияющих на позиции акцептора, то данный фактор написания домена стоит примерно на 279 месте.

Есть какие-то данные, которые могут это подтвердить?

Посмотрите запрос автоперевозки: первые две компании по вашему самые релевантные?

А почему по запросам на первых местах стабильно сидят сайты

- окна www.okna.ru

- сейф www.safe.ru

- фитнес www.fintes.ru

- машина www.mashina.ru

- батут www.batut.ru

хотя некоторое время назад там были совсем другие домены?

У вас есть в продвижении сайты, имя которых идентично ключевому слову? У меня есть и я знаю, насколько больше тратят конкуренты, чтобы быть в топе. А вы смотрели бэки таких сайтов? Я смотрел через выгрузку вебмастера бэки ещё одного подобного сайта: 50 бэков, и ни одного прямого ключа, везде разбавки с адресом сайта в тексте ссылки или картинки. Сайт стабильно в топ10, хотя по внутренним факторам он также проигрывает всей десятке.

datot:
Возраст сайта - чушь окончательная. Возраст не играет никакой роли, ни весом, ни прочим.

Аналогично предыдущему пункту. Покажите пример сайта моложе года в конкурентной тематике по конкурентному запросу.

naleks:
v. Возраст сайта-донора - Возраст страницы-донора - учитываете?

Интересно.

Варианты определить возраст страницы-донора - наличие PR, индексация, дата индексации?

Есть предположения, как именно может влиять возраст? Для каких сайтов? Для молодых, для старых?

naleks:
тИЦ страницы-донора - ТИЦ у внутряка, может быть в том случае, если он описан в Яке, в противном - ТИЦ у домена :)

Опечатался, спасибо за поправку :)

naleks:
Тематичность страницы-донора странице-акцептору - Вовсе не обязательно :)

Почему такое наблюдение? Есть опыт подтверждающий это?

Если речь не о конкретной ссылке, а о % тематичных сайтов среди всей ссылочной массы?

naleks:
Уровень вложенности страницы-донора - т.е страницы большого УВ - плохо ранжируются?

Если рассуждать по аналогии с распределением PR, то страницы большего уровня вложенности могут иметь меньшее значение, если только на них не стоят внешние ссылки.

naleks:
Про ссылки - посещаемость сайта акцептора где - как фактор?

Про посещаемость сайта-акцептора в разделе 26.

Кстати, натолкнули на мысль, что с помощью Яндекс с помощью своей Метрики мог бы, например, отследить переходы с внешних ссылок на сайт, и если, скажем, по ссылке никто не перешел, учитывать её меньше, чем если ссылка действительно дает сайту трафик, а значит полезна для посетителей.

naleks:
2. Текстовое окружение /ru/forum/comment/6922656

Логично.

naleks:
NOINDEX - Содержимое тэга и признаки клоакинга - от индексации закрыты обрывки предложений и части слов - Это делают неумелые сателитчики, которые таким путем пытаются уникализировать контент ;)

Именно, вопрос в том, как к этому относится Яндекс, находит ли он это автоматически.

naleks:
NOINDEX - Содержимое тэга и признаки клоакинга - от индексации закрыты обрывки предложений и части слов - Кстати, плашки и полотна, закрытые блоком в ноуиндекс - по моим наблюдениям, учитываются в какой-то степени, как негативный фактор.

Слышал такое мнение. Есть какие-то эксперименты, примеры на этот счёт?

ApokalipsYs добавил 30.06.2010 в 14:28

naleks:
i. Использование бесплатных общедоступных CMS без доработок
ii. Использование стандартных шаблонов
- Мильон раз обсуждалось :)

Так давайте подытожим :)

ApokalipsYs добавил 30.06.2010 в 14:34

Tarry:
Имеется ввиду ссылки с первого экрана "сильнее" чем из подвала. Вполне рабочий критерий. По крайней мере гораздо реалистичней влияния процента отказов. У яндекса у самого процент отказов я думаю процентов 90. И чем выше качество поиска, тем и процент выше. Короче есть специфика ресурса.

Хотя конечно ссылки просто делятся на натуральные и коммерческие, и скорее всего метод определения сам по себе состоит из оценки подмножества параметров.

Логично, что ссылка, по которой кликают должна иметь больший вес, поскольку это говорит об её полезности для посетителей сайта. Т.е. даже если ссылка "продажная" в этом случае она не засоряет интернет, а повышает удобство пользования.

Если на сайте стоит Метрика, Яндекс может учитывать переходы с внешних ссылок, соответственно в этом случае её визуальная близость к началу страницы, вполне может быть косвенным фактором, влияющим на клики.

Если Метрики нет, вероятно, фактором может быть близость ссылки к началу кода, но в этом случае, визуально, ссылка может располагаться в самом низу сайта и быть практически незаметной для посетителей.

9. Сайт

i. Количество страниц
1. Количество страниц на сайте
2. Количество страниц, содержащих конкретное ключевое слово
ii. Дата первичного захода робота ПС на сайт
iii. Тип сайта
1. Информационный ресурс
2. Коммерческий ресурс
iv. Наличие дубликатов страниц на сайте
v. Массовое дублирование контента

10. Тип запроса

i. Содержание запроса
1. Информационный
2. Коммерческий
ii. Степень конкретизации запроса
iii. Специфика запроса (колдунщики Яндекса) http://company.yandex.ru/technology/features/?ncrnd=6285

11. Участие сайта в дополнительных сервисах Яндекса

i. Яндекс.директ
ii. Яндекс.маркет
iii. Яндекс.адреса
iv. Регистрация сайта на важных интернет-ресурсах
1. Яндекс.каталог
2. DMOZ
3. Каталог Mail
4. Отраслевые каталоги
a. Пример: http://www.stroyfirm.ru/ для строительных организаций

12. Документ

i. Возраст документа
ii. Расширение документа
iii. Размер документа
iv. Вложенность документа

13. Географическое расположение

i. Регион в Яндекс.каталоге
ii. Адреса на сайте
iii. Контакты на сайте
iv. Информация о компании на сайте
v. Присвоенные сайту регионы

14. Размещение рекламы на сайте

i. Баннеры
ii. Popup
iii. SEM
1. Яндекс.директ
2. Бегун vs Google.Adwords

iv. Продажные ссылки
v. Для новых сайтов - сколько прошло времени, прежде чем сайт стал размещать рекламу

15. Javascript

i. Элементы навигации и отображения текста через javascript

16. Внутренние ссылки

i.Перелинковка страниц
1. Кольцевая
2. Односторонняя
3. Взаимная
ii. Количество ссылок на одной странице
iii. Тип ссылки
1. Со сменой документа
2. Якорь

iv. Ссылка объектом или текстом
v. Дублирование ссылок
vi. Ссылки на внешние ресурсы
1. Адрес внешнего ресурса
2. Текст ссылки
3. Мнение Яндекса о внешнем ресурсе
vii. Ключевые слова в тексте исходящих ссылок;
viii. Наличие, количество и % ссылок на внешние ресурсы;

17. Фреймы

i. Наличие фреймов
ii. Содержимое фреймов

18. ЦСС

i. Дисплей нон
ii. Использование одинаковых оформлений для тегов форматирования текстов (когда h1 и h2 выглядят одинаково)

19. CMS

i. Использование бесплатных общедоступных CMS без доработок
ii. Использование стандартных шаблонов

20. Яндекс.Вебмастер

i. Наличие сайта в панели Яндекс.вебмастер
ii. Настройка выгрузки обратных ссылок
iii. Факт переписки с саппортом Яндекса

21. Карта сайта

i. Наличие карты сайта
ii. Актуальность карты сайта
iii. Приоритет индексации для страниц в карте сайта

22. История сайта в динамике

i. Изменение ссылочной массы
1. Массовое снятие ссылок
2. Массовый прирост ссылок
3. Динамика прироста ссылочной массы
4. Динамика снятия ссылок

ii. Изменение владельцев домена
iii. Полная замена сайта на домене
iv. Изменение содержания сайта
1. Резкое увеличение контента сайта
2. Резкое уменьшение контента сайта

v. Полная замена сайта с изменением тематики
vi. Однократное наложение санкций на сайт/домен
vii. Неоднократное наложение санкций на сайт/домен
viii. Распределение внешних ссылок по тИЦ
ix. Распределение входящих ссылок по критерию "количество внешних ссылок на страницах донорах"

23. Сниппет

i. Плотность ключевых слов в сниппете*

24. Внешние ссылки

i. Количество внешних ссылок на странице
ii. Общее количество внешних ссылок на всем сайте-доноре
iii. Количество внутренних ссылок на странице
iv. Количество контента на странице
v. Возраст сайта-донора
vi. Возраст домена-донора
vii. Уникальность контента на странице
1. По отношению к другим сайтам
2. По отношению к другим страницам данного сайта
viii. Траст донора
ix. Позиции донора в ПС
x. Постоянство ссылки (текст ссылки неизменен и ссылка постоянно находится на этой странице)
xi. Наличие донора в важных каталогах
1. Яндекс.каталог
2. DMOZ
3. Mail
4. И т.п.

xii. тИЦ страницы-донора
xiii. Мнение Яндекса о других сайтах, на которые ссылается донор
xiv. Тематичность страницы-донора странице-акцептору
xv. Наличие в контенте страницы-акцепторы ключевых слов, встречающихся в тексте ссылки, размещенной на странице-доноре
xvi. Вес, получаемый страницей-донором из внешних ссылок
xvii. Вес, получаемый сайтом-донором из внешних ссылок
xviii. Вес, получаемый страницей-донором из внутренних ссылок
xix. Уровень вложенности страницы-донора
xx. Вхождение ключевого слово в текст ссылки
1. Прямое
2. Разбавленное
3. Нет вхождения ключевого слова
xxi. Содержание текста ссылки
1. Поисковый запрос
2. Связанные слова, не являющиеся поисковым запросом
3. Бессвязный набор слов
4. Название сайта/адрес сайта и т.п.
xxii. Расположение ссылки
1. Удаленность от начала страницы
2. Текстовое окружение
3. Содержание пассажа с текстом ссылки

25. Анкорлист

i. Уникальность анкорлиста
ii. Развесовка (соотношение ключевых слов)

26. Посещаемость

i. По данным счетчиков статистики Liveinternet и т.п.
ii. Посещаемость с различных источников

27. Посещаемость с поиска

i. CTR сайта в результатах поиска Яндекса
ii. % отказов в результатах поиска Яндекса(когда человек открыв сайт и просмотрев его продолжает поиск)

28. Яндекс.Метрика

i. Ходят ли на сайт люди не с поисковых систем
1. Закладки
2. Переходы по ссылкам
3. Реклама
ii. % отказов
iii. Поведение пользователей на сайте
iv. Удобство сайта для пользователей

29. Sitemap

i. Приоритет страницы
ii. Дата обновления страницы
iii. Дата обновления sitemap
iv. Наличие sitemap на сайте

30. Robots

i. Инструкции индексации
ii. host

2. Серверные ответы

i. Редиректы
1. Наличие редиректов на сайте
2. Код редиректа
a. 301 (Данный редирект говорит браузеру (или поисковому боту), что запрашиваемая страница/сайт НАВСЕГДА перенесены в другое место назначения, и перенаправляет на это другое место.)
b. 302 (Данный редирект говорит браузеру (или поисковому боту), что запрашиваемая страница/сайт ВРЕМЕННО перенесены в другое место назначения, и перенаправляет на это другое место.)
3. Идентичность контента начального и конечного адресов

Ставится ли редирект, например, по причине смена дизайна сайта с сохранением структуры и контента, или контент страниц после смены адресов существенно изменился.

4. Идентичность документа начального и конечного адресов

Поменялся ли только адрес страницы, или сама страница также была изменена.

5. % страниц с редиректом от общего количества страниц сайта

Будет ли Яндекс как-то иначе ранжировать сайты, на которых для 50% страниц настроен редирект?

6. Количество редиректов на пути 1 страницы

Встречаются даже комбинации 302 -> 301 -> 301 -> 301 -> 301.
Вопрос в том, как на подобные комбинации реагирует Яндекс.

ii. 404 ошибка
Как сервер отображает 404 ошибку? Отдает ли он поисковой системе пустую страницу, или же показывает страницу заглушку?
1. Пустая страница
2. Страница хостера
3. Главная страница сайта
4. Специальная 404 страница
iii. 5xx: Server Error (Ошибка сервера).
iv. 2xx: Success (Успешно).

3. Работа сервера

i. Скорость загрузки страницы

О том, как влияет скорость загрузки страницы на её релевантность.

ii. Аптайм (как часто при посещении робота сайт не работает?)

О том, как Яндекс будет ранжировать сайт, если сервер периодически падает. В ряде случаев, после выпадения сайта из индекса и повторной переиндексации, его позиции существенно ухудшались и долгое время не восстанавливались.

iii. Время отклика
iv. Географическая зона сервера

4. Домен

i. Открыта ли информация о владельце
ii. Дата регистрация домена
iii. Длина домена
iv. Доменная зона

5. Группа доменов (сетка сайтов)

i. Совпадает ли информация о владельце у нескольких доменов
ii. Совпадает ли дата регистрации у нескольких доменов
iii. Совпадает ли ссылочная масса у нескольких доменов
iv. Совпадает ли cms у нескольких доменов
1. Правило формирования URL
2. Структура сайта
3. Распределение страниц по уровням вложенности
4. HTML верстка
5. CSS
v. Совпадает ли регистратор у нескольких доменов
vi. Совпадает ли хостинг/ip у нескольких доменов
vii. Совпадают ли темпы прироста ссылок у нескольких доменов
viii. Ссылаются ли друг на друга несколько сайтов
ix. Совпадает ли контент у нескольких сайтов
x. Совпадают ли контактные данные на нескольких сайтах
1. Телефоны
2. ICQ, Skype и т.п.
3. Mail
xi. Совпадают ли адреса и названия организация на нескольких сайтах
xii. Совпадает ли название или часть названия у доменов.
xiii. Совпадает ли информация об организации в данных о регистрации домена, на сайте и в справочниках организаций.
xiv. Наличие доменов в Яндекс.вебмастер
1. В одном аккаунте
2. На разных аккаунтах, используемых исключительно для анализа сайта, посещаемых одним и тем же пользователем, заходящим с одного IP

6. URL

i. Ключевое слово в имени домена

1. На транслите
2. На английском языке
3. Словоформы/сокращения/аббревиатуры

ii. Ключевое слово в директории или названии документа
1. На транслите
2. На английском языке
3. Словоформы/сокращения/аббревиатуры

iii. Ключевое слово в названии файла
1. На транслите
2. На английском языке
3. Словоформы/сокращения/аббревиатуры
iv. Составное ключевое слово/однословный ключ
v. Ключевое слово в навигационном URL
vi. Правило формирования URL
vii. Расширение документа
viii. Возраст URL страницы
ix. Ключевые слова в URL исходящих ссылок
ix. Наличие перменных и параметров в URL

7. Контент

i. Грамотность
1. Корректное написание текста (%орфографических и пунктуационных ошибок)
ii. Количество контента
iii. Содержание ключевых слов
1. Прямые вхождения
2. Словоформы
iv. Содержание стоп слов
v. Плотность весовых слов

Есть предположение, что построив график распределения слов по их абсолютному или относительному весу можно определить "замыленность" текста.
1. Слова с низким весом
2. Слова с средним весом
3. Слова с высоким весом

vi. Тип ключевых слов
1. Коммерческое
2. Информационное
3. Географическое
vii. Язык контента
viii. Кодировка
ix. Возраст контента
x. Знаки препинания, как элементы разбивки текста на пассажи.
xi. Уникальность контента (соотношения уникального контента на сайте к неуникальному)(изначально, текущее, в динамике)
xii. Ложность контента
xiii. График роста контента (сразу – потом) (частота выкладки)
1. Сайт визитка
2. Интернет магазин
3. Информационный сайт
4. Соц сеть.
5. И т.п.
xiv. Динамика обновления контента
xv. Видимость контента (контент не пытаются скрыть скроллами, написать мелким шрифтом или белым цветом на белом фоне)
xvi. Клоакинг (поисковая система видит одну страницу, человек другую)

8. Картинки

i. Наличие картинок
ii. Уникальность картинок
iii. Количество картинок
iv. Размер картинок
v. Ключевые слова в имени файла;
vi. Ключевые слова в ALT картинки;
vii. Ключевые слова в TITLE картинки;
viii. Количество картинок с ключевым изображением;
ix. Ключевые слова в H1 на странице;
x. Ключевые слова в Strong на странице;
xi. Ключевые слова в Keywords на странице;
xii. Ключевые слова в Description на странице;
xiii. Расширение картинки;
xiv. Размер картинки;
xv. Наличие нескольких размеров картинки;
xvi. Ключевые слова в URL страницы с картинкой;
xvii. Ключевые слова в изображении картинки;
xviii. В тексте входящих ссылок (внутренняя перелинковка);
xix. Текст-описание на странице;

 

1. HTML теги

i. H1-H6
1. Наличие ключевых слов в заголовке
2. Порядок употребления заголовков
a. Пропуск заголовков (h1, h3, h4)

Имеется ввиду конструкция, когда в тексте страницы заголовок h3 следует сразу после h1, минуя h2.

b. Повтор заголовков (h1, h1, h1)

Имеется ввиду конструкция, когда в тексте страницы несколько раз используется заголовок, например h1,h1,h1.

c. Последовательность заголовков (h1,h2,h3 или h4,h2,h1)

3. Наличие не ключевых слов в заголовке

Заголовки условно можно поделить на содержащие только ключевые слова (пр. «Пластиковые окна») и разбавленные (пр. «Установи пластиковые окна на кухне и получи кастрюлю в подарок!»)

4. Длина заголовка

Под длиной заголовка подразумевается количество слов, разделенных пробелом, составляющих заголовок.

5. Уникальность заголовка внутри сайта

Здесь и далее под уникальностью внутри сайта подразумевается сравнение содержимого страницы с содержимым других страниц сайта.

6. Уникальность заголовка в интернете

Здесь и далее под уникальностью в интернете подразумевается сравнение содержимого страницы с содержимым других сайтов интернета.

7. Близость заголовка к началу документа


Подразумевается удаленность тэга заголовка от начала страницы в HTML коде.
ii. Элементы абзаца: STRONG, EM, B;
Элементы списка LI
1. Наличие ключевых слов во фрагменте
a. Прямое вхождение ключевого слова/Словоформа

Предполагается, что Яндекс по разному ранжирует прямое вхождение ключевого слова и его словоформы, т.е. текст на странице сайта «остекление балконов» и «остекление балкона» будет давать странице разный вес по ключевому слову «остекление балконов».

b. Полный ключ/Часть составного ключевого словосочетания

Предполагается, что Яндекс при ранжировании документа по составному ключевому слову учитывает не только полное словосочетания, но и отдельные его части. Так слово «окно», отдельно встречающееся в тексте, может повысить релевантность документа по ключевому слову «окна пвх»
2. Наличие не ключевых слов во фрагменте

Речь идет о содержании тэга: содержится в нем только ключевое вхождение, или же оно разбавлено.

3. Длина фрагмента


Количество слов, заключенных в тэг, и разница между словосочетанием и абзацем, выделенным этим тэгом.

4. Плотность ключевых слов

Отношение ключевых слов к неключевым словам, заключенных в тэги.

5. Распределение весов слов

Вес слова проще всего считать по обратному значению количества найденных страниц по этому слову. Чем на меньшем количестве страниц встречается слово, тем больший вес оно имеет.
Под распределением весов слов подразумевается разница между ранжированием текстов «наши лучшие красивые пластиковые окна из германии идеально вписываются в интерьер вашего дома», где каждое слово имеет низкий вес и замылено и «В течение нескольких лет обыватель привыкал к пластиковым окнам, а в середине шестидесятых…»

iii. P
1. Наличие ключевых слов во фрагменте
a. Прямое вхождение ключевого слова/Словоформа
b. Полный ключ/Часть составного ключевого словосочетания
2. Наличие не ключевых слов во фрагменте
3. Длина фрагмента
4. Плотность ключевых слов
iv. Description
1. Наличие ключевых слов во фрагменте
2. Уникальность
v. Keywords
1. Содержание фрагмента
vi. NOINDEX
1. Содержимое тэга
a. Признаки клоакинга - от индексации закрыты обрывки предложений и части слов
vii. TITLE
1. Вхождение ключевых слов
a. Полное вхождение/неполное вхождение
b. Прямое вхождение/непрямое вхождение
2. Плотность вхождений

3. Близость вхождений к началу TITLE

Предполагается, что удаленность ключевого слова от начала TITLE влияет на релевантность.

4. Уникальность TITLE внутри сайта

Имеется ввиду уникальность TITLE данной страницы в сравнении с TITLE других страниц сайта. Предполагается, что страницы, на которых TITLE дублируется, могут ранжироваться ниже, из-за спама

5. Расстояние между повторением ключевых слов

Слишком частое повторение ключевых слов в TITLE может быть расценено как спам, черезчур разбавленный неключевыми словами TITLE будет иметь низкую релевантность.

6. Разделители
(;)(:)(|)(,)(.)(!)(/)


Бытует мнение, что использование некоторых разделителей нежелательно.

7. Наличие неключевых слов

Речь о разбавленности TITLE неключевыми словами.

8. Веса неключевых слов

9. Регистр написания ключевых слов

10. Длина TITLE

Речь о количестве символов в TITLE.

11. Кол-во слов в TITLE

12. Удаленность частей составных ключевых слов

Когда на страницу продвигается большое количество запросов, для того, чтобы написать читаемый TITLE, приходится повозиться, придумывая замысловатые фразы, содержащие части важных составных ключевых словосочетаний. Речь о том, на какое расстояние можно разнести части составного ключевого словосочетания, чтобы не сильно потерять в релевантности.

13. Уникальность TITLE среди всей коллекции документов Яндекса


Имеется ввиду уникальность TITLE данной страницы в сравнении с TITLE всех страниц, проиндексированных Яндексом. Предполагается, что страницы, TITLE которых дублируется где-то ещё, могут ранжироваться ниже.
viii. Связки
1. <P> vs <H1-H6>

Бытует мнение, что корректно верстать страницы по следующей схеме:

Заголовок
Абзац
Заголовок
Абзац


При этом ключевые слова в Абзаце имеют больший вес, если они встречаются в предшествующем этому абзацу заголовке.

2. <STRONG>, <B>, <EM> vs <P> vs <H1>-<H6>

Аналогично предыдущему, бытует мнение, что ключевые слова, заключенные в теги <STRONG>, <B>, <EM> имеют больший вес, если они встречаются в предшествующем заголовке.

3. <STRONG> vs <B> vs <EM> vs <LI> vs <H1>-<H6> vs <A>

Бытует мнение, что наличие ключевого слово в нескольких значимых тэгах повышает вес каждого отдельного элемента.

4. Key vs <KEY>

Бытует мнение, что ключевое слово, заключенное в значимый тэг имеет больший вес, если в тексте это слово также употреблено без тэгов.

5. Keywords vs Key

http://help.yandex.ru/webmaster/?id=1111858 – может учитываться, если содержимое страницы будет соответствовать содержимому тэга keywords.
ix. Наложение тэгов
1. H1-H6 vs STRONG vs B vs EM vs LI vs A vs P

Бытует мнение, что при пересечении тэгов поисковая система не может корректно ранжировать их содержимое.
Примеры:
	<H1><A>key</A></H1>
<H1><STRONG>key STRONG></H1>
mhz:
aphextwin2000,
Disallow: /*utm_source


Тогда он сам параметр оставит в индексе, просто сведёт все значения к какому-то одному.

Действительно, я ошибся.

Спасибо.

Это метка GoogleAnalytics для рекламы Яндекс.директ.

Чтобы исключить такие страницы из индекса нужно прописать в robots.txt в разделе

User-agent: Yandex

Clean-param: utm_source
Всего: 405