В Яндексе сначала редирект запросов вот сюда http://captcha.yandex.net/ а потом http://captcha.yandex.net/robot.html
В гугле http://sorry.google.com/sorry/ и http://sorry.google.com/sorry/misc/
Работали. В те времена когда XSS давал прирост ТИЦ. Сейчас можно не тратить время на это.
Он использует Яндекс для получения результатов.
Вероятность, что юзер находится на любой странице, и сумма всех вероятностей - несколько разные вещи. Вспомните физический смысл понижающего коэффициента 🚬
Вы просто не знаете реальное количество таких "уникумов", которое вылезло после этого апа 🚬 Тех, кто промолчал о своих PR7-8 значительно больше. Говорить о зеркалах бессмысленно - это не клей.
Обычно используется либо один прокси, требующий авторизации, либо список адресов без авторизации. Хотя вполне достаточно будет использовать формат, описаный в RFC3986
[username[:password]@]hostname[:port]
Какой бы вариант мы ни выбрали, на достаточно большой выборке обязательно найдутся контр-примеры, где он не сработает. Так что можно только увеличить степень достоверности, но не получить 100% точность.
Для себя я реализовал проверку следующим образом:
1. Проверка с помощью оператора info:
2. Если на первом шаге не нашли, для статики делаю дополнительный запрос site:url, для динамики site:host+url и ищу совпадение адреса в первой десятке результатов если их больше одного.
Погрешность определения есть, конечно, но она меньше чем у просто info: и работает быстрее и безопаснее чем cache:
Вышла версия с регуляркой.
Ufaweb, запихнешь все условия из своей темы в одно выражение? 🚬
Попробуйте таким способом проверить вот эту страницу, она тоже есть в кэше.
http://tyca.ru/nforum/topic.php?forum=6&topic=137766&page=4
Этот запрос не годится по той простой причине, что для динамических URL он обрежет всю ссылку, начиная со знака вопроса, и выдаст огромную простыню результатов.
Собственно единственный способ проверить индекс - использовать оператор cache, но такие запросы в больших количествах проверять просто не реально, гугль блокирует IP уже после 25-30 ссылок.
Чтобы поменять 25 рублей на 30 придется перезаключать все договора, а на это никто не пойдет. Так что просто забейте.
Вот конкретный пример
"Между каналами переднего корня обычно имеются анастомозы"
В выдаче всего две страницы, одна из них определяется как не в индексе