- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Люди добрые, завтра защита курсового на тему "Технологии поисковых систем интернет".
В ходе предзащиты всплыл ряд вопросов у преподавателя.
Большое спасибо всем тем, кто откликнется.
1.Как поисковая система узнает про страницу, которая появилась в сети, не была внесена для индекса , не имеет внешних ссылок на нее?
2.С помощью какого протокола происходит поиск страниц роботом поисковой системы?
3.Механизм работы робота в плане распространения по сети? Как обращается к DNS серверу, что посылает, что получает?
Делаете доклад по поисковым технологиям, а поиском не пользуетесь - как так? :)
Посмотрите здесь:
http://company.yandex.ru/press/2002/10-29_01.xml
Как поисковая система узнает про страницу, которая появилась в сети, не была внесена для индекса , не имеет внешних ссылок на нее?
Строго говоря, поисковики пытаются избавлятся от таких страниц. Узнают просто - через бар, когда идёт запрос на получение PageRank (или аналогичные параметры), а Рамблер - по загрузке счётчика с этой страницы.
2.С помощью какого протокола происходит поиск страниц роботом поисковой системы?
HTTP
Механизм работы робота в плане распространения по сети? Как обращается к DNS серверу, что посылает, что получает?
Crawler абсолютно точно не обращается к DNS - это лишние для него действия, да к тому же он как правило берёт не одну страницу с домена, а много. Хранит записи DNS и следит за их актуальностью самостоятельный модуль поисковика, который роботом обозвать сложно.
Crawler абсолютно точно не обращается к DNS - это лишние для него действия, да к тому же он как правило берёт не одну страницу с домена, а много. Хранит записи DNS и следит за их актуальностью самостоятельный модуль поисковика, который роботом обозвать сложно.
А где можно посмотреть подробную архитектуру поисковой системы?
Еще мне не знакомо такое понятие как "бар".
http , как мне кажется , распространяется "поверх" tcp протокола?
где можно посмотреть подробную архитектуру поисковой системы
Выше Ярослав дал ссылку. На http://company.yandex.ru/ есть много статей, в т.ч. и описывающих архетектуру Яндекса. А ещё в статьях есть ссылки на источники, т.е. на статьи, описывающие как устроены другие поисковики.
не знакомо такое понятие как "бар".
Бар - это сокращение от тулбар (toolbar), т.е. панели инструментов. Подробности в любом поисковике набрать [тул]бар + имя поисковика
http , как мне кажется , распространяется "поверх" tcp протокола?
Это к чему? Он с таким же успехом может распространятся по любому другому сетевому протоколу (какой там протокол у сотовых телефонов?) но суть его от этого не изменится. :)
Выше Ярослав дал ссылку. На http://company.yandex.ru/ есть много статей, в т.ч. и описывающих архетектуру Яндекса. А ещё в статьях есть ссылки на источники, т.е. на статьи, описывающие как устроены другие поисковики.
Пролистал на счет архитектуры, но ничего вразумительного не нашел... Может посоветуете еще где посмотреть... Нужна аппаратная реализация архитектуры любой поисковой системы, накрай - структурная схема. Во вторник последняя защита...
Эм... а что вы вообще в своем курсаче-то делали?
Что значит "нужна аппаратная реализация архитектуры"? Вы сами понимаете употребляемые термины? Если нет - не употребляйте не к месту.
Да конечно удивительно как вы писали курсовой если не знаете(не можите найти) ответы на свои вопросы.
посмотрите здесь http://www.rambler.ru/doc/architecture.shtml
http://images.rambler.ru/legal/architecture.gif
Это конечно не последние данные, но довольно полезная информация.
Эм... а что вы вообще в своем курсаче-то делали?
Что значит "нужна аппаратная реализация архитектуры"? Вы сами понимаете употребляемые термины? Если нет - не употребляйте не к месту.
Тема "Технология Поисковых Систем Интернет".
Термины, написанные мной, я прекрасно понимаю...
Что вам непонятно?
Может есть еще люди, которым не понятны мои вопросы? Или это единичный случай?
Структурная схема-это хорошо... Нужна именно аппаратная реализация, вплоть до типа кабеля между серверами... Это не совсем то... Но спасибо за помощь...
Jetsan, странно, что такие вопросы появляются у Вас непосредственно перед защитой, а не возникли во время написания работы. И чтоб не совсем офф-топ, вот ещё немножко на "почитать":
http://turtle.ru/db/architecture/
Наслаждайтесь.