Видимо, проиндексированных Гуглом, а тут нужно общее кол-во страниц сайта, в не зависимости от индексации ПС.
Это не возможно.
Кто же тогда ему список всех адресов (урл) сайта даст, он только из контента, скачивая каждую страницу это может вытащить...
Что такое скрипт?
Если тот, который Вы запустите, то этот способ Вам ничего существенного не сэкономит относительно Телепорт. Ну разве только место на ЖД и усилия по нажатию кнопки свойства на папке, для подсчета кол-ва. А время и трафик... нет, тоже самое будет.
А если скрипт - это у Вас чужой веб сервис/служба, то представьте, какой там канал должен быть, при 10Мбит, ru зона годы качаться будет.
Даже если кто что-то подобное и затеил, то представляю, какая у него будет актуализация :)
Даже www.webarchive.org и тот нормально задачу архива всех страниц не может решить...
Какие же тут могут быть проблемы?
Размещенный код AdSense права на вывод денег не дает, все права остаются у Вас.
ИМХО.
Четкие дубликаты отдельных страниц на разных сайтах - в общей массе нечетких дубликатов редкость, по крайней мере, что бы их как-то отдельно фильтровать на этапе индексации - выигрыша особенного нет.
Нечеткие дубликаты отдельных страниц на разных сайтах фильтруются, как Вы сказали, по сниппетам, в момент запроса.
Не четкие и четкие дубликаты сайтов приводят к образованию зеркал, этим занимается зеркальщик.
Четкие дубли страниц на одном сайте приводят к склейке, в т.ч. ссылочного.
Четкие (пока несклеянные) и нечеткие дубли страниц, фильтруются по сниппетам в момент запроса.
Может Вам вот это нужно?
Смысл в том, что через расширенный поиск задаем поиск в домене .jp и язык английский.
Что же Вы им объясняли? :)
Одно и тоже объявление Adsense может работать на любом количестве сайтов, без всяких извещений Google об этом.
Это Вам только в плюс - халявные клики на доп. сайтах.
Ну, это все равно, что говорить, что статистика Rambler примерно не отражает статистику Яндекс по поиску.
Или котировки одной биржи forex отличаются от другой биржи forex.
Понятно, что везде есть свои приверженцы, но не настолько же 😕
Вообще никогда не понимал <noindex>. Это ж клоакинг чистой воды :)
Пользователю одно, а ПС другое.
Подозрительно!
А значит где-то вилы имеются и не так все радужно...
Делимся! :)