Расширенные запросы в Яндексе

CS
На сайте с 26.10.2004
Offline
109
1053

Возможно ли такое:

1. Получить тексты ссылающихся сайтов. То есть не просто выделить кусок текста в ссылках и узнать их количество, а сами тексты ссылок.

Разработка мобильных приложений и веб-сервисов (https://webparadox.ru/)
CS
На сайте с 26.10.2004
Offline
109
#1

Не пойму почему молчание?

1) Глупый вопрос.

2) Никто не знает.

3) Знают, но не хотят делиться.

4) Это не возможно.

K
На сайте с 31.01.2001
Offline
737
#2

Алгоритм ясен, значит можно написать такую программу.

Кое-что может semonitor, но как-то не очень хорошо.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
CS
На сайте с 26.10.2004
Offline
109
#3

Kost, Можно пример такой по не конкурентному запросу.

Нету у меня Semonitora - a netPromoter не умеет такого.

А алгоритм не совсем очевиден...

[Удален]
#4

Алгоритм простой.

1) Получить список ссылающихся страниц.

2) Выкачать все эти страницы. Найти на них нужные ссылки, и их тексты.

CS
На сайте с 26.10.2004
Offline
109
#5

Задача не всегда тривиальная.... У многих ссылок нет постоянного адреса.

NL
На сайте с 29.01.2003
Offline
212
#6

CreaSoft, а какой "масштаб бедствия"? Сколько нужно ссылок обработать - 50, 1000, 1000000? Если немного - то можно и ручками. И с какой целью? Если для эксперимента, то скорее всего можно и не все ссылки колошматить =)

M
На сайте с 12.05.2005
Offline
133
#7
CreaSoft:
Возможно ли такое:
1. Получить тексты ссылающихся сайтов. То есть не просто выделить кусок текста в ссылках и узнать их количество, а сами тексты ссылок.

Можно, работы на сутки. Предложение в личку плз.

K
На сайте с 31.01.2001
Offline
737
#8
Задача не всегда тривиальная.... У многих ссылок нет постоянного адреса.

Если ссылка не найдена на выкачанной странице, а вам очень надо ее найти (или все ссылки с сайта), значит надо выкачать весь сайт.

CreaSoft, посмотрите на свой ник, вам и карты в руки ;)

Кстати, у Semonitora есть демка на 60(!) дней. Вы ее пробовали?

M
На сайте с 12.05.2005
Offline
133
#9
Kost:
Если ссылка не найдена на выкачанной странице, а вам очень надо ее найти (или все ссылки с сайта), значит надо выкачать весь сайт.

Чушь, фактически на глубину не более линка, если ссылки нет, то её в 95% нет вообще.

CS
На сайте с 26.10.2004
Offline
109
#10
NULL:
CreaSoft, а какой "масштаб бедствия"? Сколько нужно ссылок обработать - 50, 1000, 1000000? Если немного - то можно и ручками. И с какой целью? Если для эксперимента, то скорее всего можно и не все ссылки колошматить =)

Анализ и эксперимент...

Но руками не выйдет...

Уж много у кого проверять. 🚬

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий