Методы проверки индексации (непота, etc) ссылок

C
На сайте с 22.04.2005
Offline
43
#81

Доделали наконец скрипт. Заняло больше времени, чем предполагалось, так как решили предусмотреть также различные нюансы типа проиндексированности ссылки только быстророботом, наличие в тексте ссылки спецсимволов, которые надо удалять при подаче запроса к Я и т.д.

Предлагаю всем желающим сравнить результат работы скриптов. Присылайте в личку выборки сайтов, указывая результат проверки вашим скриптом. Буду возвращать результат проверки своим.

юни
На сайте с 01.11.2005
Offline
902
#82

Chewi, полный метод озвучим? :)

https://a-parser.com/ - парсер для профессионалов SEO, маркетологов, арбитражников и SaaS, https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
M
На сайте с 29.10.2005
Offline
171
#83
Chewi:
2. Искать в полученном списке документов страницу, которая не является исходной страницей-донором, ссылается на акцептор, и анкор ссылки с которой идентичен анкору ссылки донора.

в этом пункте, Ваш скрипт ищет тоже по сохраненным копиям, и отделяет ли их от быстророботовских?

Благотворительный фонд помощи бездомным животным "Кот и Пес" -сайт для неравнодушных людей (http://www.pesikot.org)
C
На сайте с 22.04.2005
Offline
43
#84
юни:
Chewi, полный метод озвучим? :)

Да он, собственно, уже был озвучен неоднократно в этом топике.

Из того, что не озвучено - нужно учитывать, как Яндекс индексирует, какие-то нюансы (например то, что я написал в предыдущем посте). Я отнюдь не уверен, что мы все эти нюансы учли, и учли правильно :) Поэтому и предлагаю желающим потестировать и сравнить со своими результатами.

Margo:
в этом пункте, Ваш скрипт ищет тоже по сохраненным копиям, и отделяет ли их от быстророботовских?

Ищет по сохраненным копиям. Отделяет. Точнее, должен отделять, но пока таких не попадалось (мы пока протестировали не много сайтов). Если у Вас есть пример такого сайта, пришлите плз.

M
На сайте с 29.10.2005
Offline
171
#85
Chewi:
Ищет по сохраненным копиям. Отделяет. Точнее, должен отделять, но пока таких не попадалось (мы пока протестировали не много сайтов). Если у Вас есть пример такого сайта, пришлите плз.

то есть не попадались быстророботовские?.... вы анкоры с донора берете по сохраненной копии ? смотрите чтобы она была не быстророботовская?....а ведь еще при поиске уникальных ссылок при просмотре остальных сайтов, которые могут содержать активную ссылку на изучаемый акцептор тоже нужно по идее смотреть по сохраненным копиям? так?

C
На сайте с 22.04.2005
Offline
43
#86
Margo:
то есть не попадались быстророботовские?.... вы анкоры с донора берете по сохраненной копии ? смотрите чтобы она была не быстророботовская?....а ведь еще при поиске уникальных ссылок при просмотре остальных сайтов, которые могут содержать активную ссылку на изучаемый акцептор тоже нужно по идее смотреть по сохраненным копиям? так?

Анкоры берем с сохраненной (и вот здесь быстроробота еще не попадалось), а что касается второй части, то такого не делали (хотя по идее надо :)). По идее надо не только смотреть, быстророботная она или нет, а если быстророботная, то брать для этого документа сохраненную копию версии не от быстроробота и смотреть, есть ли в ней проверяемая ссылка или нет. И вот если в обычной версии документа ссылки нет, а в быстророботной есть, то, по идее, в анкор-файл акцептора эта ссылка еще не попала, и поэтому при проверке уникальности ее учитывать не нужно.

M
На сайте с 29.10.2005
Offline
171
#87
Chewi:
Анкоры берем с сохраненной (и вот здесь быстроробота еще не попадалось), а что касается второй части, то такого не делали (хотя по идее надо :)). По идее надо не только смотреть, быстророботная она или нет, а если быстророботная, то брать для этого документа сохраненную копию версии не от быстроробота и смотреть, есть ли в ней проверяемая ссылка или нет. И вот если в обычной версии документа ссылки нет, а в быстророботной есть, то, по идее, в анкор-файл акцептора эта ссылка еще не попала, и поэтому при проверке уникальности ее учитывать не нужно.

в том то и дело, что не только донорскую сохранненную копию нужно брать нужную, но и остальных потенциальных доноров при проверки на уникальность...быстророботные часто попадаются, как вы их так берете, что они вам не попадаются? по какому принципу?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий