dantess

dantess
Рейтинг
133
Регистрация
06.11.2004
nickspring:
Сервис врет, вы не учли некоторые факторы.

Если не секрет - подскажите в личку какие именно, кроме указанных здесь:

http://nepota.net/about.html

burunduk:
1.а что значит ошибка?
2.не коректно есть ошибки

"ошибка" - в каком именно контексте?

Ошибкой система обычно называет статус страницы у которой часть ссылок под фильтром, а часть - нет.

Осталось много кривых формулировок (за программером надо зачистить) - тестим еще )

Boris Shramko:
А что значат уникальные хосты?

Кол-во уникальных внешних ссылок на странице

Dm:
И что значит
Непот не наложен: 6
Непот наложен: 3 [список урлов]

А вот это - одна из вещей, на которую хотелось бы обратить внимание общественности по поводу природы того, что сейчас принято называть "непотом" или по поводу самой методики.

указанные цифры говорят о том, что часть ссылок (6) работает, а часть, предположительно, под фильтром (3).

Собственно - фильтр наложен не на всю страницу, а только на часть ссылок.

Еще есть подобный интересный момент - фильтр, судя по всему, накладывается на конкретную страницу, а не на сайт целиком.

Господа разработчики!

Имейте совесть - почините уже, наконец, парсеры ;(

2 минуты работы чтобы исправить ;(

Недели 2 еже не работают ;(

XeRmit:

По теме апа: ИМХО отладка фильтров еще в процессе, я бы сказал, в стадии непубличной альфа-версии! ;)

Я бы сказал ПУБЛИЧНОЙ 😂

upyrj:

Анонсирована бета-версия сервиса Каширина; есть непубликуемый скрипт у New_Angel; есть примочки для браузеров. Тем временем, первые два мало кто видел, а примочки только ускоряют процесс, не более того.

У меня тоже есть сервис ;) тоже закрытый пока ;) даже с плагином к sape ;)

tmvrn:
Может Яндекс опять формат выдачи сменил?

Не "может", а сменил ☝

Я вот уже обновил сегодня свои парсеры (не SST).

<ol class="results"> сменилось на <ol class="results" start="1">

тег элемента списка теперь не имеет атрибутов, вот так: <li>

wkw:
Бред полный. Но я хотел бы разобраться до конца. Ху ис Ху в этоп непоте!

в обсуждаемой сейчас методике определения непота есть достаточное кол-во исключений, когда "в лоб" проверить не получается - нужно делать дополнительные проверки: в Вашем случае хорошо было бы посмотреть переколдовку:

(("дипломная::126642 работа::1057 на::0 заказ::2330 заказать::4955 курсовую::33447 работу::1057" << url="www.nickart.spb.ru"::1819103916:0) | ("дипломная::126642 работа::1057 на::0 заказ::2330 заказать::4955 курсовую::33447 работу::1057" << url="www.diptime.ru"::1819103916:0))//6

видим - "на" имеет нулевой вес, следовательно (раз уж применены кавычки) фразу "дипломная работа на заказ, заказать курсовую работу" нужно разбить на 2 части (без "на") - тогда все ок.

еще из простого - хорошо бы и страницу-акцептора проверять на наличие в индексе в настоящий момент (надоевшее всем выпадение морд).

из сложного - сам до конца еще не разобрался (если кто сталкивался и разобрался (или хочет разобраться) - welcome в личку) - не всегда корректно все выходит с аббревеатурами независимо от переколдовки.... и еще ряд мелких исключений

P.S. к слову, и серверный скрипт для определения непота почти готов. осталось только все вот такие исключения повылавливать...

тоже интересно чего там и как:

adm.in [at] mail.ru

спасибо!

XTR:
Полный непот, считается, что можно определять так:

("уникальная фраза со страницы-донора"<<url="адрес страницы-акцептора")|("уникальная фраза со страницы-донора"<<url="адрес страницы-донора")

уникальная фраза со страницы-донора должна быть единственной для данной страницы-акцептора в ее анкор-листе.
Если непот есть, то страница-акцептор не будет найден по ссылке, а если нет - будет найден по тексту ссылки.

зачем нужна 2-я часть запроса (после символа "|")? если ее убрать - только донор пропадет из результатов. больше ни на что не повлияет...

Всего: 389