- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Что такое ШИНГЛ?
Пассаж - это часть текста?
http://www.yandex.ru/yandsearch?text=%D1%88%D0%B8%D0%BD%D0%B3%D0%BB&site=http%3A%2F%2Fcompany.yandex.ru%2F&ras=1&site_manually=true
Пассаж - это часть текста?
Что такое Яндекс.Пассаж ... или ограничен длиной или разметкой текста (теги типа <p> <div> <td> <li> <br>. "Инлайновые" <i> <b> <span> не ограничивают).
Часто (но не всегда) это предложение, начавшееся с большой буквы и закончившееся точкой.
Можете поискать слова и содержимое разных пассажей попадёт в сниппете в разные текстовые фрагменты (будет в разных строках, если текст не в теге <pre> посмотрите код страницы).
а сравниваются пассажи по алгоритму ШИНГЛЫ.
Это уже при детальном анализе. А для всей страницы формируется "супершингл", по которому и происходит сравнение по всей базе. Для этого параметра формируется индекс, а это значит, что определение уникальна ли страница, или нет, сводится к менее чем
ln(число страниц в базе Яндекса) / ln(2)
сравнением чисел.
(Если кол-во страниц в индексе Яндекс выдаёт честно, то это около 32-х сравнений чисел)
Т.е. фактически, Яндексу это ничего не стоит с точки зрения мощности
не думаю что сравнение идет со всей базой, скорее при выкачки сайт метится в зависимости от контента и идет сравнение лишь со смежными секторами.
не думаю что сравнение идет со всей базой, скорее при выкачки сайт метится в зависимости от контента и идет сравнение лишь со смежными секторами.
Для тех, кто в танке - сравнить супершингл со всей базой проще и быстрее, чем по каким-либо "умозрительным" алгоритмам.
Вот здесь Яндекс упоминает о применении этой методики: http://company.yandex.ru/articles/spamooborona.html
Обсуждение на SE: /ru/forum/83293
а сравнивать супершинлг лишь в отдельном секторе еще проще и быстрее чем по всей базе