Если не секрет - подскажите в личку какие именно, кроме указанных здесь:
http://nepota.net/about.html
"ошибка" - в каком именно контексте?
Ошибкой система обычно называет статус страницы у которой часть ссылок под фильтром, а часть - нет.
Осталось много кривых формулировок (за программером надо зачистить) - тестим еще )
Кол-во уникальных внешних ссылок на странице
А вот это - одна из вещей, на которую хотелось бы обратить внимание общественности по поводу природы того, что сейчас принято называть "непотом" или по поводу самой методики.
указанные цифры говорят о том, что часть ссылок (6) работает, а часть, предположительно, под фильтром (3).
Собственно - фильтр наложен не на всю страницу, а только на часть ссылок.
Еще есть подобный интересный момент - фильтр, судя по всему, накладывается на конкретную страницу, а не на сайт целиком.
Господа разработчики!
Имейте совесть - почините уже, наконец, парсеры ;(
2 минуты работы чтобы исправить ;(
Недели 2 еже не работают ;(
Я бы сказал ПУБЛИЧНОЙ 😂
У меня тоже есть сервис ;) тоже закрытый пока ;) даже с плагином к sape ;)
Не "может", а сменил ☝
Я вот уже обновил сегодня свои парсеры (не SST).
<ol class="results"> сменилось на <ol class="results" start="1">
тег элемента списка теперь не имеет атрибутов, вот так: <li>
в обсуждаемой сейчас методике определения непота есть достаточное кол-во исключений, когда "в лоб" проверить не получается - нужно делать дополнительные проверки: в Вашем случае хорошо было бы посмотреть переколдовку:
(("дипломная::126642 работа::1057 на::0 заказ::2330 заказать::4955 курсовую::33447 работу::1057" << url="www.nickart.spb.ru"::1819103916:0) | ("дипломная::126642 работа::1057 на::0 заказ::2330 заказать::4955 курсовую::33447 работу::1057" << url="www.diptime.ru"::1819103916:0))//6
видим - "на" имеет нулевой вес, следовательно (раз уж применены кавычки) фразу "дипломная работа на заказ, заказать курсовую работу" нужно разбить на 2 части (без "на") - тогда все ок.
еще из простого - хорошо бы и страницу-акцептора проверять на наличие в индексе в настоящий момент (надоевшее всем выпадение морд).
из сложного - сам до конца еще не разобрался (если кто сталкивался и разобрался (или хочет разобраться) - welcome в личку) - не всегда корректно все выходит с аббревеатурами независимо от переколдовки.... и еще ряд мелких исключений
P.S. к слову, и серверный скрипт для определения непота почти готов. осталось только все вот такие исключения повылавливать...
тоже интересно чего там и как:
adm.in [at] mail.ru
спасибо!
зачем нужна 2-я часть запроса (после символа "|")? если ее убрать - только донор пропадет из результатов. больше ни на что не повлияет...