iseg
Что значит tf idf? Нельзя ли попроще и поподробнее объяснить?
Да не зеркала это - факт. Да и на клоакинг не похоже. Ведь адреса страниц разные, а при клоакинге по одному адресу разные страницы живут. И за спам - просто выкидывают сайт из базы, и все. А тут путаница какая-то...
Яндекс не знает ни одной страницы, ссылающейся на deez.com.ua/17/8/: http://www.yandex.ru/yandsearch?text=%23link%3D%22deez.com.ua%2F17%2F8%2F%22
А ВИЦ в баре Яндекса демонстрируетя не для текущей страницы, а для главной страницы сайта, на котором находится загруженная страница, т.е. ВИЦ 69.06 - это ВИЦ страницы deez.com.ua
Но дело, собственно, не в этом. Почему Яндекс показывает найденные слова на странице с другого сайта?
Не сильно, а вот риск загреметь в яндексовский бан-лист (если только каждая такая страница не будет шедевром) возрастет (Илья Сегалович называет такие вещи непотистским спамом и обещал за него карать). Дело в том, что при ссылочном ранжировании учитывается PR (ВИЦ) страницы, на которой стоит текстовая ссылка. Поэтому подобные страницы на Народе не дадут большого эффекта, если только их самих не раскрутить в плане повышения PR.
Если быть точным, то паук не лайкосовский, а фастовский. Да, действительно, он, подобно гугловскому, сам довольно резво ходит по ссылкам. И если на твой сайт активно ссылаются, то есть неплохая вероятность, что фастовский робот его сам найдет. А вот про влияние DMOZ'а на результаты Лайкоса ничего сказать не могу. Сам Лайкос пишет Portions powered by FAST. Значит, логично предположить, что Лайкос, пользуется и еще чем-то кроме FAST'а.
Почему нет? Overture после платных результатов выдет результаты из базы Inktomi. А бесплатно запостить в Inktomi можно через HotBot ( http://hotbot.lycos.com/addurl.asp ) или MSN Search ( http://submitit.bcentral.com/msnsubmit.htm ) Правда, говорят, не всем везет, но у меня проблем с попаданием таким способом в базу Inktomi не было.
Оба этих поисковика сейчас пользуются чужими базами. Поэтому сабмитить надо в поисковики, чьими базами они пользуются.
Lycos - базой FAST'а ( www.alltheweb.com ).
Excite - базой Overture (бывш. GoTo) ( www.overture.com ) .
У тебя. Я попал туда без проблем.
Вообще-то в данной дискуссии мы обсуждаем вопрос о качестве контента, а не о его наличии.
Я привел эти примеры для того, чтобы показать, что качество контента, о котором так много говорится в обсуждаемой статье, для поисковика не так уж и важно. Важно лишь, чтобы слова из поисковой фразы встречались хотя бы по разу на странице. Остальное можно сделать и не притрагиваясь к контенту.
И на закуску пример страниц без контента (в том смысле, что в ее коде нет ни одного слова из ключевой фразы).
4-е место в Гугле по запросу plant encyclopedia - www.ivillage.com . Вот ее сохраненная Гуглем версия
AiK
Еще в догонку пример из АльтаВисты. Запрос computer programmer . 2-е место. Страница www.mikemeaney.com . Как Вы думаете, насколько хорошо ее контент соответствует запросу?
[This message has been edited by wolf (edited 26-02-2002).]