Вопрос знатокам языка запросов Яндекса

К
На сайте с 03.02.2005
Offline
74
1061

Не откажите в любезности.

Никак не могу сообразить, какую конструкцию из операторов надобно соорудить, чтобы Яндекс вернул список всех внешних исходящих ссылок конкретного сайта.

Есть пара операторов, которые потенциально могут в этом деле помочь ($anchor (запрос) и link="www.url.ru/cat/*"), но решить проблему с их использованием у меня не получается, в частности, не могу их заставить воспринимать регулярные выражения.

В принципе, проблема легко решается простым спайдером каким-нибудь, но хочется найти элегантное решение, не требующее выкачивания сайта на локальную машину.

Заранее благодарю.

С Уважением, Алексей.

Успешный_Во_Всем
На сайте с 27.07.2006
Offline
9
#1

Кот, Возможно, я что-то не понимаю, но разве перед link="www..." не надо ставить # ???

"Результат - Это показатель наших истинных намерений"
Z
На сайте с 23.06.2006
Offline
16
zig
#2
Кот:
Не откажите в любезности.
Никак не могу сообразить, какую конструкцию из операторов надобно соорудить, чтобы Яндекс вернул список всех внешних исходящих ссылок конкретного сайта.

Исходящих:)

Хорошо придумали конечно, но Яндекс такой информации не дает.

Он дает для сайта ВХОДЯЩИЕ:) ссылки, может отфильтровать их по ключевым словам в ссылке.

Можно еще задать область поиска "ссылающийся сайт", и определить где и как ссылкается один сайт на другой.

Но для вашей цели ничего не подойдет.

Но все ИСХОДЯЩИЕ с сайта - такой информации не предусмотрено.

Да и в чем проблема-то?

Запустите паучка небольшого, пускай прошерстит странички и будет вам список для анализа.

К
На сайте с 03.02.2005
Offline
74
#3
Успешный_Во_Всем:
Кот, Возможно, я что-то не понимаю, но разве перед link="www..." не надо ставить # ???

Не надо. Но можно и поставить :)

К
На сайте с 03.02.2005
Offline
74
#4
zig:
Исходящих:)
Хорошо придумали конечно, но Яндекс такой информации не дает.

Не надо ждать милостей от природы (с) и далее по тексту :)

Но все ИСХОДЯЩИЕ с сайта - такой информации не предусмотрено.

Вам следовало сделать акцент на слове "все", а не на "ИСХОДЯЩИЕ". С исходящими-то как раз не сложно справиться при помощи перечисленных выше операторов. Но, хоть в них и предусмотрено использование регулярных выражений в виде "*", эта самая звездочка начинает работать криво при попытке выудить ВСЕ исходящие. Не исключено, что это сделано умышленно, чтобы не давать оптимизаторам лишний инструмент. Что само по себе странно - действительно, всю инфу по исходящим легко получить, просканировав сайт одной из многочисленных программ.

Соответственно, я надеялся на то, что либо мне укажут на мою ошибку в работе с операторами, либо шепнут на ушко подходящий оператор "для служебного пользования", отсутствующий в открытой печати :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий