Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science
это что? шутка? Попробуйте поискать тоже самое в каталоге Яндекса

Причем здесь первый сайт? В выдаче из 10 результатов 4 с бесплатного хостинга narod.ru, 1 - с by.ru (2 из них зарегистрированы в каталоге). Текст произведения присутствует только на lib.ru и только на 9-м месте.

P.S. Это обычная констатация факта.

ну раз конструктивные ответы это понты и пафос, то ... удачи этому форуму

Алексей, конструктивные ответы можно давать в топике ниже о поиске bigmir'а. Здесь же это воспринимается как флейм.

P.S. Ничего личного.

ЗЫ еще примеры?

Да самый простой запрос. Надеюсь, не стоит объяснять, что там должно быть?

P.S. Алексей, большая просьба - весь пафос и понты оставьте в форуме Вебмана, иначе будут применены санкции. Очень некрасиво получается - посмотрите, зачем и кем был открыт этот топик и в какой флейм его превратили.

Периодически Яндекс теряет огромный массив ссылок, однажды уже проиндексированных. Есть у кого-то подобный опыт, и как с этим бороться? Заранее спасибо.

Это не самая большая беда - через недельку пройдет и все снова появится.

Вот последний апдейт Яндекса весьма впечатляет - везде narod.ru

вылез. :(


By the spring of 1993, Segalovich had fully optimized the program and fixed the major bugs. The delighted Volozh asked Segalovich to come up with a name for it. Segalovich stayed up all night, scribbling ideas in a notebook. Finally, he stumbled on "Yandex," by taking the English word "index" and replacing the letter "I" with the Cyrillic letter "я."

Во сне наверное приснилось, как Менделееву. :D

также стоит сравнить качество поиска по данному запросу:
бигмир - 8 банков, сайт о украинских банках и один промах (банк данных предприятий Украины)
уаплюс - 4 банка, все остальное промах (финансовые или новостные сайты написавшие о банках)

К слову, это еще ни о чем не говорит. Навигационные запросы из одного слова вполне могут отрабатываться и поиском только по каталогу.

Если так хочется помериться силенками, нужна комплексная оценка по запросам разных типов для полноты и точности.

По идее оттеснит он Мету. Дело времени

По слухам, Мета сейчас не развивается, потому что на это нет средств. А если нет средств, то сразу напрашивается интересный вывод о перспективности развития поисковиков на Украине.

Кстати, Алексей, статистика по количеству запросов в Мете более-менее известна. А какова она сейчас у поиска Бигмира, если не секрет?

Vyacheslav Tikhonov, на форуме прочитал, что, чем выше на странице находится код, тем лучше. Получается, это не так?

Это так. Сначала текст разбивается на логические блоки, например, абзацы. Чем выше абзац, тем больший рейтинг получат слова из него.

Это связано с тем, что обычно в начале идет резюме или оглавление всего текста.

И если можно, поподробнее о том, как именно выделяются слова и про "портрет".

Из текста извлекается каждый термин, которому приписывается координатная информация. Например, так:

термин id_абзаца id_предложения id_слова

Затем рассчитываются веса каждого термина по TD*IDF

метрике - учитывается, сколько раз термин встречается в коллекции документов и сколько в данном документе. Затем на этот вес накладываются координатные характеристики (наличие в заголовке, в тексте ссылок и т.д.)

Все это сохраняется в поисковом индексе.

Существует ли некий рейтинг этих слов, зависящий от того, как эти слова были вами описаны при создании страницы?
Я так понимаю, он есть. Я прав?

Каждое слово имеет свой вес. Чем чаще оно встречается в коллекции документов, тем этот вес меньше.

Если бы при каждом апдейте давались разные приоритеты параметрам, то выдачу переворачивало радикально.

Внимательно читайте верхние посты - выдачу не может перевернуть радикально там, где нет конкуренции. Как ни крути, а там сайты оказались за счет хорошего контента, поэтому изменение некоторых параметров на них не отражается. Выдача переворачивается там, где идет постоянная оптимизация или же в результатах поиска стоят авторитетные ресурсы.

Поэтому для подавляющего большинства сайтов позиции почти не зависят от апдейта. В то же время у кого-то что-то пропадает и начинаются крики: "Да это Яндекс глючит!"

Да не причем тут тиц.
К примеру есть сайт, который выходит по конкретному запросу в пятерке, хотя у него вообще тиц 0.

тИЦ, конечно, не причем, просто позволяет поверхностно оценить авторитетность сайтов в выдаче. Если авторитетных сайтов там нет, то это разговор ни о чем - нет там конкуренции.

Всего: 847