- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Вот интересно стало, как работают такие сервисы как filesearch.ru, tagoo.ru, mp3000.net и подобные?
Неужели сами по страничкам лазиют? Или всё же пользуются ПС?
Расскажите пожалуйста!
Я уверен, что используют ПС, а именно проиндексированные страницы сайта, далее парсят на наличие ссылок на файлы с определенным расширением и заносят в каком-то своем виде эту информацию в базу.
Конечно робота поискового можно и самому написать, но наверное это на любителя :)
Вот поподробнее хотелось бы узнать, т.к. интерес не праздный, нужно написать подобный сервис для внутренних нужд сайта.
Если ткнёте носом, где поискать, буду признателен:)
Вот ссылочка была, как парсить выдачу поисковиков http://parsing-and-i.blogspot.com/2008/10/i.html, реализовано на делфях, но думаю труда не составить портировать под свой язык.
Это к теме использования поисковых систем.
Конкретно в вашем случае не могу ничего точнее сказать, так как незнаком с алгоритмами работы приведенных вами в пример сервисов :(
Вот интересно стало, как работают такие сервисы как filesearch.ru, tagoo.ru, mp3000.net и подобные?
http://google.ru/search?q=%22windows%22+filetype%3Azip
Ufaweb, эт понятно.
Но как, например, найти трек dj tiesto - flight 643. Просто проиндексировать вручную все найденные файлы, считав тэги?
есть ещё идеи?
Вот интересно стало, как работают такие сервисы как filesearch.ru, tagoo.ru, mp3000.net и подобные?
Неужели сами по страничкам лазиют? Или всё же пользуются ПС?
Расскажите пожалуйста!
Язык запросов яндекса смотрели? http://help.yandex.ru/search/?id=481939
Есть оператор MIME.
Например, при запросе в яндексе парсинг<<mime="DOC" получите только вордовские документы в результатах поиска.
Так же для других типов файлов - HTML,PDF,DOC,PPT,XLS,RTF,SWF
Можно еще указать язык, дату, тематику - короче, учим язык запросов.
Как же организовывать сбор данных и выдавать результаты поиска дело абсолютно интимное.
serg-deev, спасибо, буду посмотреть
парсить пски конечно хорошо, но в том случае пока у вас меньше 100 запросов в минуту, в противном случае забанят вас по IP .. так что лучше кравлёра своего писать
парсить пски конечно хорошо, но в том случае пока у вас меньше 100 запросов в минуту, в противном случае забанят вас по IP .. так что лучше кравлёра своего писать
Можно все сниппетыы из серпа в свою базу напарсить и вуаля..