- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Приветствую!
Кто-нибудь может рассказать о существующих технологиях определения похожих страниц?. Т.е. к примеру, когда google.com выдает список результатов поиска, то показывает "Найти похожие страницы" возле каждой ссылки. Так вот - КАК он определяет похожие страницы на данную?
Если это уже обсуждалось, киньте, плиз, ссылку - я не смог найти через поиск форума :) ...
По схожести контента и/или backward links.
По схожести контента и/или backward links.
собственно это понятно... я имею в виду, какие технологии могут быть использованы для определения схожести контента?
т.е. к примеру, что мне приходит на ум - это выделить клчевые слова для каждой страницы и затем искать страницы с такими же ключевыми словами. Так как сравнение по всем словам долго и неэффективно.
Но здесь не совсем понятно как определять ключевые слова для страницы, по какому критерию?
А что еще используется, какие другие алгоритмы?
это вы с Сергеем Брином беседуете? :) Его здесь пока не замечено.
Для страницы, на которой мы с вами находимся Гугль дает:
Контент, похоже, не играет решающего значения :)
Форум о поисковых системах
Форум о поисковых системах : 2.2.6 Форум о поисковых
системах, Просмотр сообщений за ...
- 37k - Сохранено - Похожие страницы
Краткая история фирмы CANON / «ViTCOM Web»
Версия для печати Краткая история фирмы
CANON Фирма Canon является крупнейшим ...
vitcom.top.lv/photo/canon/history.php3 - 8k - Сохранено - Похожие страницы
Internet Archive
Search: All Media Types ...
Описание: Working to build a digital library of internet sites and other cultural artifacts in digital form....
Раздел: Computers > Internet > Resources > Research
www.archive.org/ - 62k - Сохранено - Похожие страницы
Словарь фото терминов / «ViTCOM Web»
Версия для печати Словарь фото терминов
Авотобрэкетирование - автоматическая ...
vitcom.top.lv/photo/dictionary.php3 - 14k - Сохранено - Похожие страницы
Choise your connection speed ... Modem 56K 256Kbps 512Kbps 1Mbps ...
Choise your connection speed ... Modem 56K.
gap.infonet.ee/speed.php - 2k - Сохранено - Похожие страницы
DeletedDomains.com: The ultimate source for deleted and onhold ...
Welcome to DeletedDomains.com, the most comprehensive FREE research tool
for finding "deleted" and "on-hold" domains. Current Statistics. ...
www.deleteddomains.com/ - 12k - Сохранено - Похожие страницы
Поиск в Интернете | Персоналии
Тема: Поиск в Интернете. ...
websearch.report.ru/_5FolderID_222_.html - 29k - Сохранено - Похожие страницы
Поиск в Интернете | Новые материалы
Report.ru - сообщество экспертов, RLE Banner Network.
НА ГЛАВНУЮ СТРАНИЦУ • О ПРОЕКТЕ ...
websearch.report.ru/_5FolderID_20_.html - 14k - Сохранено - Похожие страницы
Компания Телепортал.ру
2 декабря На новом портале Репорта "Метеорология"
Вы найдете самые интересные сведения ...
www.teleportal.ru/ - 20k - Сохранено - Похожие страницы
Существует два подхода определения близости двух документов - на основе статистической модели (мера косинуса - LSA/LSI/PLSA и т.д.) и технологии, основанные на знаниях.
Стандартный алгоритм определения близости - можно рассчитать меру косинуса угла между двумя документами:
http://citeseer.nj.nec.com/ding99similaritybased.html
Обзор всех возможных методов можно почитать на
http://www.dialog-21.ru/Archive/2001/volume2/2_26.htm
Также можно посмотреть http://www.ksl.stanford.edu/people/stolle/Papers/brants-lrec.pdf , здесь неплохое введение в тему.
это вы с Сергеем Брином беседуете? :) Его здесь пока не замечено.
Для страницы, на которой мы с вами находимся Гугль дает:
Контент, похоже, не играет решающего значения :)
Сергея Брина не видел :) даже не знаю кто это....
Хм... да уж, похожесть по контенту особо не радует... Я попробовал в яндексе поискать похожие страницы - Яндекс нашел более-менее похожие по довольно общей теме, но по смыслу все-таки они не сильно похожи...
Существует два подхода определения близости двух документов ...
Отлично, это то что мне было надо, спасибо Вячеслав.