Впечатление от поиска на ЧЕРЕПАХЕ

1 234
euhenio
На сайте с 21.09.2001
Offline
357
#21
Грохнулся один из серверов, ответственный за индекс от русской "А" до "К". Специалисты выехали.

-от А до К - 8 букв. => всего у них 4 сервера

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
F
На сайте с 15.11.2000
Offline
116
#22
Как писал itman
в реальном инете частота изменения страницы и ее популярность неплохо так коррелируют.

Тогда возникает вопрос: почему поисковик должен выдавать популярные страницы в ответ на запрос? С этим справляется и рейтинг Рамблера. Переиндексация нужна, прежде всего, чтобы выдаваемая поисковиком информация была актуальна, и найденная страница (сайт) соответствовали тому, что знает о них поисковик. С этой точки зрения соотношение затраты/качество гораздо лучше для меры, выбранной в статье.

Быстро меняющиеся страницы, как правило, сами не содержат ценную информацию, а только анонсы и ссылки (представьте, как выглядит новостная лента или раздел форума), поэтому их постоянная переиндексация ставит целью получить, прежде всего, новые URL. А эта задача касается уже не свежести, а объема базы.

Поэтому мне трудно согласиться, что в статье выбрана некорректная мера оценки свежести страниц. А если верна мера, то верны и выводы.

С уважением,

Александр Садовский.

LM
На сайте с 30.11.2001
Offline
71
LiM
#23
Как писал euhenio

-от А до К - 8 букв. => всего у них 4 сервера

Неверное предположение. А про латиницу, как минимум, вы забыли?..

Серверов может быть и больше и меньше. Судя по описанию системы, нагрузка распределяется равномерно между всеми машинами, но ведь слов, начинающихся на разные буквы, разное количество.

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
euhenio
На сайте с 21.09.2001
Offline
357
#24
С этой точки зрения соотношение затраты/качество гораздо лучше для меры, выбранной в статье.

Быстро меняющиеся страницы, как правило, сами не содержат ценную информацию, а только анонсы и ссылки

-А что же такое - качество? Для новостной информации качество (ценность) и состоит в ее новизне. И только. Философский вопрос...

Неверное предположение. А про латиницу, как минимум, вы забыли?..
Серверов может быть и больше и меньше.

- я шучу... :) Но бдительность на высоте!

_____________

Давайте соберемся в одну большую (маленькую?) кучу и обсудим, что такое - качество информации... Кто за?


Тогда возникает вопрос: почему поисковик должен выдавать популярные страницы в ответ на запрос?

-что интересно, алгоритм PageRank именно этому и способствует, выдавливая наверх страницы, которые _и_так_ имеют бОльшую вероятность попадания на них посетителя. Т.е., бОльшую популярность. Стало быть, и осмысленность использования такого алгоритма надо обдумать...

F
На сайте с 15.11.2000
Offline
116
#25
Как писал euhenio
Для новостной информации качество (ценность) и состоит в ее новизне.

Некорректно приравнивать новостные страницы ко страницам, содержащим новостную информацию. Даже самые большие страницы газет редко содержат новости целиком -- только анонсы со ссылкой, ведущей на статью. Поэтому нельзя говорить о том, что нужно их переиндексировать ради сохранения новизны новостной информации -- вся информация находится в глубине сайта, на отдельных страницах. Эти отдельные страницы-статьи почти не нуждаются в переиндексации, так как они годами не меняются.

Что получается? Большинство изменчивых страниц можно переиндексировать не чаще, чем обычные страницы, если будет способ извлекать из них новые ссылки. А способ этот есть, называется Яндекс.Бар и тулбар Google.

Давайте соберемся в одну большую (маленькую?) кучу и обсудим, что такое - качество информации... Кто за?

Как всегда, все кончится попойкой? ;)

Встреча в офлайне сопряжена с определенными трудностями в виде перемещения из одного государства в другое. А начать новую ветку форума может любой, если тема будет интересна, участники форума поддержат ее.

алгоритм PageRank именно этому и способствует, выдавливая наверх страницы, которые _и_так_ имеют бОльшую вероятность попадания на них посетителя.

Вес PageRank отличается от обычной посещаемости тем, что "доля качества" в нем заметно выше. Посетителей можно нагнать рекламой, а создать мгновенно сайт с хорошим PR невозможно. Что касается проблемы выбора между сайтом-старожилом и сайтом-новичком (при равном качестве информации), то она есть, и часто решается не в пользу новичков. Но качество при этом, как правило, не страдает.

С уважением,

Александр Садовский.

I
На сайте с 26.05.2001
Offline
64
#26

Вот в этом-то и вся фишка, что абсолютное большинство, но

не все. А то, что изменчивые странички нужно переиндексировать

чаще, чтобы извелечь из них нужные ссылки (на постоянные адреса

новостных статей например) это уже дело десятое.

Важно то, что если мы это не будем делать, то качество информации

(на интуитивном уровне) будет сильно ниже. А как перейти

от понятия интуитивному к формальному? Например, приписать большой

вес таким страничкам. Кто сказал, что большие веса будут

у многих страничек? Они будут только у 0.001 всех страничек

если не меньше, но модель, предложенная в статье

это никак не учитывает.

Нет, ну мне нравится пример из статьи с двумя страницами,

одна из которых меняется 10 раз в день, а другая 1.

Если есть возможность обновлять ровно страницу в день, то

оптимум достигается, если переиндексировать только одну

страницу (которая меняется раз в день), а другую не трогать!!!

ну, а если часто меняющаяся пага содержит анонсы сайта,

на который ходит миллион посетителей в день, а другую

посещают раз в полгода?

И кому такая стратегия обновления нужна,

даже если средняя "свежесть" базы, высчитываемая, как среднее

количество актуальных страниц (усредненное по времени) максимальна? :-))

Как писал funsad

Что получается? Большинство изменчивых страниц можно переиндексировать не чаще, чем обычные страницы, если будет способ извлекать из них новые ссылки. А способ этот есть, называется Яндекс.Бар и тулбар Google.

....

С уважением,
Александр Садовский.
Приходите завтра, завтра будет! (http://itman666.livejournal.com)
euhenio
На сайте с 21.09.2001
Offline
357
#27
Даже самые большие страницы газет редко содержат новости целиком -- только анонсы со ссылкой, ведущей на статью. Поэтому нельзя говорить о том, что нужно их переиндексировать ради сохранения новизны новостной информации -- вся информация находится в глубине сайта, на отдельных страницах.

-Сами анонсы, могут быть в каком-то смысле полезными. Но, главное, полные тексты новостей, лежащие в глубине сайта, и есть ценные. Т.к. новые и полные.

Как всегда, все кончится попойкой?

-скорее, начнется :)

Fad
На сайте с 25.09.2001
Offline
124
Fad
#28

Да, я долго искал свой сайт, пока не набрал url/

Turtle хвалится объемом базы, хотя главное в поисковике

не это. Главное - качество поиска...

Что толку от того, что по запросу он выдает на 20% больше информации.

ВСЯ эта информация замусорена дорвеями и т.д. По своему запросу

я не увидел не одного достойного сайта. Три странички с narod.ru и 5 страниц с др. беспл. хостингов. И это из 10 позиций.

Не одного сайта с действительно качественным содержанием.

В общем Turtle надо срочно работать над алгоритмами ранжирования.

С уважением, Фадеичев Андрей, руководитель проекта "Биржа контента eTXT.ru" (http://www.etxt.ru/)
F
На сайте с 15.11.2000
Offline
116
#29
Как писал itman
Важно то, что если мы это не будем делать, то качество информации
(на интуитивном уровне) будет сильно ниже.

Почему же? Качество информации (зависящее от переиндексации) кажется пользователю низким, если в выдаче поисковиков видна новость, а на странице ее нет. Доля устаревших страниц будет минимальной именно при выбранной мере. Следовательно, пользователь будет натыкаться на них намного реже, и ощущаемое им качество поиска будет максимальным.

Если же считать, что качество поиска зависит от факта нахождения требуемой новостной информации, то, как уже обсуждалось, здесь требуется индексация новых страниц, а не обновление старых.

С уважением,

Александр Садовский.

F
На сайте с 15.11.2000
Offline
116
#30

Webrating опубликовал интервью с Еленой Воробьевой, руководителем отдела по связям с общественностью Stack Group. В нем названы некоторые числа, например, $150 тыс. -- первая очередь аппаратуры, а также обсуждены некоторые вопросы, касающиеся результатов поиска.

С уважением,

Александр Садовский.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий