Эксперименты в ранжировании

12
Denisg
На сайте с 10.01.2008
Offline
136
1105

Что необходимо для постановки эксперимента по ранжированию сайта в поисковых

системах? Например есть несколько сайтов - мы должны определить каким образом

тот или иной сайт выше и почему. Первое - необходимо понять, что произошло в

поисковой системе с каждым апдейтом, например - у нас есть сайт А и сайты Б, В,

Г, Д, Ж, З, И, К. И после обновления сайт К становится на первой позиции.

Можно проверять:

1) Вхождение ключевых слов на странице - например: это может быть по плотности,

чем выше плотность вхождения, тем лучше.

2) Фактор наличия заглавной буквы в запросе и в Title - насколько влият

Постановка эксперимента в этом случае такая - если в ПС с заглавной буквы сайт

отображается выше при прочих равных условиях, значит такой фактор имеется.

3) Геозависимость - тут все просто. Если сайт находится выше по определенному

заданному региону, то в таком случае, необходимо проверить на сайте наличие

ключевых слов, связанных с регионом и городом.

4) Ключевые слова - идут друг за другом или встречаются в тексте в разнозненом

виде, насколько важен фактор нахождения в предложении или в документе.

Сколько на странице тэгов h1, h2, h3.

5) Каков внешний вид сайта - длина страницы, объем страницы.

Например, сколько весит страница. В смысле не её статический вес в поисковой

системе, а в смысле сколько занимает страница если её скачать.

6) Насколько удобна навигация на сайте - какие ссылки представлены на другие

разделы внутри сайта.

В постановке эксперимента важна гипотеза, т.е. то, что мы хотим узнать и далее по методологии оценить.

К примеру, гипотеза: сайт выше, если использовать слово-запрос только лишь один раз в заглавии новости.

Гипотеза: при запросе по тематике сайта, сайты строгой тематики продвигаются выше чем другие, имеющие нетематические разделы. К примеру, на странице встречаются слова - подобные синонимам к ключевому слову, и если таких слов-синонимов на странице много, то можно говорить о том, что это есть один из факторов, влияющих на продвижение.

Или еще один фактор - например, если запрос принадлежит к группе запросов, которые набирают наиболее часто, то в таком случае сайт пессимизируется.

Какие эксперименты проводили вы?

dlyanachalas
На сайте с 15.09.2006
Offline
693
#1
К примеру, гипотеза: сайт выше, если использовать слово-запрос только лишь один раз в заглавии новости.
Гипотеза: при запросе по тематике сайта, сайты строгой тематики продвигаются выше чем другие, имеющие нетематические разделы. К примеру, на странице встречаются слова - подобные синонимам к ключевому слову, и если таких слов-синонимов на странице много, то можно говорить о том, что это есть один из факторов, влияющих на продвижение.

Начинание хорошее. Только не забудьте главный принцип - один исследуемый фактор - одна группа сайтов. Иначе запутаетесь.

[Удален]
#2
Denisg:
Что необходимо для постановки эксперимента по ранжированию сайта в поисковых системах? Например есть несколько сайтов - мы должны определить каким образом тот или иной сайт выше и почему. Похудение Харьков

Главное - соблюсти чистоту экспериментов, то есть исключить влияние посторонних факторов на результат. Если невозможно, то количество объектов исследований должно быть достаточно велико, чтобы отсеять эти факторы статистически.

[Удален]
#3

С матрикснетом в Яндексе сейчас сложно отследить действительное влияние факторов. Скорее всего, и яндексоиды его сами не знают. Но если проводить эксперимент, то, чтобы результаты были осмысленными, проверять нужно только один фактор (по нему сайты должны различаться), а остальные факторы должны быть одинаковы. Проверять несколько факторов на одной группе - это, конечно, получится заведомая ерунда.

Denisg
На сайте с 10.01.2008
Offline
136
#4

Вот интересно определить - каким образом информация с сайта попадает в поисковую систему. Бывает так, что сайты, копирующие информацию с других, находятся на первых позициях, вместо сайта оригинала.

В Яндекс возможно посмотреть - на какой позиции находится сайт по определенным запросам в конкретное время, при этом возможно уточнить только лишь по времени, но не с точностью до часа, минуты, секунды, а только лишь до дня. Каким образом тогда возможно определить источник новости?

[Удален]
#5
Вот интересно определить - каким образом информация с сайта попадает в поисковую систему.

Это очень сложный вопрос. Лучше умы бьются над ним с начала двухтысячных годов, и до сих пор не нашли ответа(((

SmileP
На сайте с 18.02.2010
Offline
386
#7
Denisg:
Вот, например влет в поисковую систему по времени не является критическим фактором

А если было бы критичным, т.е. кого первым посетил робот, того и тапки (ТОПы), представляете что было-бы?

Антон Белов
На сайте с 28.05.2010
Offline
183
#8
Denisg:
Каким образом тогда возможно определить источник новости?

а какая разница, кто источник? С чего вы взяли, что для яндекса это важно. Например, Вася Пупкин сделал открытие: фаза луны влияет на рост телеграфных столбов, написал это в своей газете, потом отправил инфу на первый канал. А на первом канале передают: Юрий Лужков сделал открытие: фаза луны влияет на рост телеграфных столбов. Ну и кому люди поверят? А ведь первоисточник то Вася Пупкин...но где ты это и кому докажешь? Да и кого это волнует...

Аудит за 100 рублей (/ru/forum/787849) теперь реальность курс Подводные камни мфа (/ru/forum/comment/11861126) - всего за 100 рублей Твой сервер снова лежит? Пользуюсь Inferno Solutions, таких проблем не знаю. (http://cp.inferno.name/link.php?id=13)
Denisg
На сайте с 10.01.2008
Offline
136
#9

Miha Kuzmin (KMY),

вот еще размышления на тему:

Факторы ранжирования в ПС

1. Просто текст

2. Размер текста

3. Плотность вхождения ключей

4. Наличие в тексте выделений <strong>, <h1> и т.д. - форматирование текста.

Например, если текст форматирован при помощи разбиения строго по стандарту html4, то в таком случае, если страница оказывается выше - утверждение что форматирование является фактором ранжирования верно.

Возникает предположение: если разбиение в тегах <div> и <p> для одинаковых, в принципе, страниц отличается (сайт находится для тега <p> на позиции выше), то в этом случае это также является фактором ранжирования.

Предположим, что объективно, форматирование по стандарту является фактором ранжирования (т.е. в контексте обязательным условием), в таком случае - это можно оставить.

5. Следующим фактором, при корректном форматировании является количество ссылок на странице, количество выделений текста в нужном объеме, т.е. если ключевые слова темы, по которой выполняется поиск находятся в тегах <b>, <strong>, <em>,<i> и т.д., то в таком случае, если сайт выше по определенным тегам, то это также можно считать фактором ранжирования.

6.Далее следует - количество ссылок на странице, т.е. если мы имеем исходящую ссылку на какой-либо другой ресурс, то сайт объективно должен ранжироваться выше, так как ссылка оказалась полезной для пользователя с точки зрения поисковой системы.

Сайт может иметь несколько страниц, например, если сайт имеет две и более страницы, по сравнению с другим сайтом при прочих равных условиях, то, в таком случае мы можем говорить о том, что это является фактором ранжирования.

7. Если сайт имеет внутреннюю перелинковку, по которой пользователь может переходить внутри сайта и эта перелинковка удобна, то, в таком случае при прочих условиях, при достаточном количестве ссылок (но не более чем определенное заданное количество) мы можем говорить о том, что это является фактором ранжирования.

8. Следующим фактором ранжирования является наличие на сайте верной структуры подачи информации. Т.е. если в странице расположение тегов заглавий указано в точно таком же порядке, как рекомендуется при написании дипломных работ или курсовых проектов, с указанием подзаголовков, оглавления – то, в этом случае мы можем говорить о том, что это является фактором ранжирования.

9. Далее, если два одинаковых сайта с верной внутренней перелинковкой (не более N ссылок на странице) участвуют в ранжировании, то возможно определить по какому из сайтов большее количество просмотров и посетителей – и время пребывания на сайте. Сайту с интересным контентом поисковая система отдаст предпочтение. Суть, контент на всем сайте должен быть тематическим.

Фактор ранжирования по тематике значительно шире в понимании поисковой системы нежели чем просто присвоение сайту определенной категории в каталоге по набору ключевых слов.

Вполне возможно, что поисковая система еще учитывает и фактор ссылок, исходящих на другие сайты – таким образом, при появлении на сайте ссылок на другие сайты, смежные или тематичные прямо, то, в таком случае сайт будет ранжироваться выше в поисковой системе при прочих равных условиях. Это уже называется внешними факторами ранжирования.

К внешним факторам ранжирования относятся еще и факторы наличия ссылок на сайт с других сайтов в поисковой системе, т.е. если на других сайтах есть определенное количество ссылок не превышающее (M), то в таком случае – можно говорить о том, что это является фактором ранжирования.

Поисковая система динамично добавляет информацию на сайт, поэтому считывание информации с других сайтов приводит к увеличению числа ссылок с некоторой скоростью. Например, в день, поисковая система может считать около 1000 сайтов, в таком случае ссылок будет K. Если поисковая система считывает 10000 сайтов, то ссылок может быть на них 10K или 10K-N.

Если в поисковой системе при этом ссылки появляются одним разом, при обновлении информации, то возможно принять это за ссылочный спам. Если же ссылки появляются довольно таки равномерно, например при ежедневном обновлении информации ПС, и из общего количества сайтов мы имеем некое среднее значение для каждого из сайтов, то это может являться фактором ссылочного ранжирования - потому что ссылки появляются на сайт постоянно.

Возможно также назвать это и Фильтром.

Если ссылки на сайт появляются и потом исчезают – то, в таком случае можно говорить о том, что ссылки носят неестественный характер, таким образом, это также можно называть Фильтром поисковой системы.

Яндекс должен уметь определять естественность ссылок, т.е. каждая ссылка должна быть не просто по вхождению ключевого слова, но еще и содержать некоторые другие слова, возможно относящиеся к тематике сайта. Кроме этого в тексте самой ссылки могут присутствовать и дополнительные символы, которые мог задать пользователь. Таким образом – такие ссылки не ограничивают пространства возможных вариантов текста ссылки.

Мы имеем два сайта со схожей структурой, при этом на одном из сайтов есть N ссылок, на другом M исходящих, K и L внутренних, ключевое слово, по которому ранжируется сайт встречается в тексте на сайте 5+-1%, на сайте расположена верная структура ссылок с учетом рекомендаций по расстановке, и при этом ПС важно определить какой сайт лучше?

Говоря о фильтрах можно также предположить что есть еще несколько фильтров, связанных с внешними факторами, например это могут быть не только прирост ссылочной массы на сайт, равномерный и отсутствие миганий ссылок, и фактор тематичности, но еще и несколько других факторов – это оценка уровня сайта в поисковой системе, с которого ссылаются – значения ТиЦ, значения PR.

Каждый сайт принадлежит определенному региону – если, например, сайт запрашивается из некоего объема данных в общей базе и сайт относится к региону, то в данном регионе он будет иметь большую позицию нежели чем другой сайт.

К следующему фактору естественности ссылки Яндекс вероятно должен причислить некий авторитет сайта с которого ссылаются. Формально этот авторитет выражается в индексе цитируемости, т.е. ТиЦ. Чем выше, тем сайт должен быть выше в ПС.

Что такое ТиЦ и как его определить. Если на сайте в общей базе в заданный конкретный момент времени есть некоторое число- позиция сайта, то, в таком случае мы можем говорить о том, что рассчтетные данные по этому сайту среди обще й базы и являются ТиЦ.

Предположим что Яндекс присвоил сайту ТиЦ, в таком случае, при прочих равных условиях сайт с большим значением ТиЦ будет получать большую позицию.

Фактором ранжирования здесь является большее число тематических ссылок с других сайтов на данный конкретный сайт.

Итак, есть сайт с исходящими, входящими, перелинковкой, верным оформлением. Далее поисковая система должна уточнить – какой сайт появился раньше, таким образом дата является фактором ранжирования в поисковой системе. Нахождение сайта и сайтов, ссылающихся на сайт является фильтром, в том случае, если на сайте присутствует один IP адрес, что на исходящем сайте, что на сайте, принимающем.

Таким образом – мы имеем:

1. Плотность вхождения

2. Наличие форматирования HTML4 (или уже 5)

3. Внутренние факторы – количество внутренних ссылок

4. Наличие внешних факторов – количество внешних ссылок. Скорость индексации ссылок. Отсутствие мигания ссылочной массы.

5. Тематичность самого сайта и тематичность исходящих и внутренних ссылок.

6. Кликабельность ссылок, т.е. насколько пользователи нажимают на ссылку (видно по переходам со страниц)

7. Время проведенное пользователями на сайте – таким образом, страницы на которых пользователь провел больше времени, считаются пользователями более интересными.

8. Конкуренция между страницами – т.е. наличие на сайте страниц с одинаковым запросом, или ядром запросов будет не релевантно.

9. Наличие на сайте Медиа – изображений, аудио, видео. Больше относится к алгоритму СПЕКТР.

10. В будущем на сайте будут оцениваться и факторы, переходов по тематике, т.е. пути ссылок по сайту, таким образом будут приводящие запросы и не приводящие запросы. Коммерческая тематика.

11. Доменное имя – ключевое слово в имени домена является фактором.

12. Следующим фактором ранжирования будет определение сути сайта – блог, портал, форум. Т.е. поведенческий фактор пользователя, при этом имеется в виду – что на сайте, с какого типа сайта перешел человек, возможно, это и социальная сеть. С сайтов – с определенного типа возможна передача информации.

Если это сайт, на котором имеются много ссылок с блогов и форумов, чем с другого сайта, то для поисковой системы этот сайт будет является пользовательским и относиться к факторам пользователя, информационным. А если этот сайт является, скажем коммерческим, то в таком случае, на сайт не будет ссылок из блогов и форумов. Так, Яндекс определяет – коммерческий это запрос или некоммерческий.

Кроме этого, Яндекс, может определить сезонность запроса, например, если по частоте запросов в поисковую систему мы имеем большее количество и меньшее в разное время года, то мы имеем фактор сезонности, но это не является ранжируемым фактором.

13. Следующим фактором ранжирования является фактор кликабельности ссылок. Если есть переходы внутри сайта, то этот сайт будет выше в поисковой системе, чем сайт, в котором нет переходов. В смысле ПФ.

15. Фактор ранжирования по кликабельности – если по ссылкам на сайте переходят, то это является фактором в смысле ПФ.

Denisg
На сайте с 10.01.2008
Offline
136
#10

Miha Kuzmin (KMY),

Предположим что есть база текстов. Рассмотрим несколько обращений. Поиск может выполняться по точному вхождению символов, по некоторому вхождению с включением конкретных слов на старнице.

При этом в результатах поиска показываются все данные.

Сам поисковый алгоритм должен быть построен таким образом, чтобы отражать максимум релевантной информации. Из этого следует - поиск, выполняемый по сложному запросу, к примеру по запросу и вхождению текста выдаст результаты в порядке своей внутренней релевантности по окончанию запроса.

Сама поисковая система хранит запросы, т.е. алгоритмы расчета - действие не динамичное. Выкладывают на сервер информацию только лишь тогда, когда завершается расчет.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий