magev

Рейтинг
28
Регистрация
16.04.2006

Я вижу возможность проверки на непот в первом приближении так:

1. Проиндексирована ссылка? Найден ли Реципиент «по ссылке»?

Посылаем текст ссылки в кавычках (исключая спецсимволы). Ищем Донора. Ищем Реципиента. Если не находим одного из них – останавливаем проверку. Проверяем, является ли найденный текст на доноре ссылкой (парсим сохраненную копию). Если все ок - п.2.

2. Есть ли дубли?

Получаем список всех сайтов, посылая текст ссылки в кавычках. По сохраненным копиям смотрим, куда ведут ссылки. Если ни одной, кроме донора не ведет на реципиент – ссылка уникальна. При первом нахождении урла реципиента останавливаем проверку (ссылка не уникальна).

Будет работать если анкоры ссылок не встречаются часто в рунете (т.к. парсить 5 558 сайтов, найденных по запросу кондиционер (http://www.yandex.ru/yandsearch?text=%EA%EE%ED%E4%E8%F6%E8%EE%ED%E5%F0)– невесело)

Вы просто находите странице на которых встречается адрес сайта www.kashirin.ru. Запрос не найдет ссылку <a href="http://www.kashirin.ru/">Каширин</a>

IgorP:
Хото что то похожее на данные которые были до того как начались мутации у Яндекса
Запрос
dantess:
Все уже придумано, скоро будет реализовано.
Вот только пункты 3-4 можно сделать несколько проще.
Подсказа: любая ссылка с анкором - это тоже текст, причем анкор нам заведомо известен в случае проверки на непот. Т.е. проверка на уникальность - не проблема.

Смотря какой анкор ссылки. Если анкор - "кондиционер" - проверка на уникальность - основная проблема.

Добавили возможность просмотра ранее проверенных сайтов. Задаете список урл, и нажимаете выполнить.

Если какие-либо урлы проверялись, системой будет предложена возможность их перепроверки ранее выполненных проверок.

В принципе и так можно посмотреть на этот вопрос... Согласен. Что меня смущает здесь - довольно часто в Я криво сохраняются копии страниц. Можно реализовать проверку по сохраненным копиям как опцию.

Kolyaj:
magev, если мы анализируем морду в целом, то нам в принципе не важно, какие ссылки стоят на ней в данный момент, важно о каких знает яндекс и какие из них он учитывает.

У меня сервис выдал вот что:

донор *****.ru

ссылок 8

идексировано 4

уникальных анкоров 3

найдено по ссылке 3

работают 3

не работают 0

проверить не удалось 5

Калинин:
Проверил один сайтег. На сайтеге 11 продажных ссылок, сервис мне показал, что 7 из них - под непотом, остальные, получается - не под непотом.
Так не бывает.
Интересно мнение владельца сервиса.

Кинте урл в личку

Kolyaj:
magev, они могут не успеть проиндексироваться, и плохо будет то, что сервис покажет, что они не работают, а на самом деле они просто не начали работать.

Сервис покажет, что работоспособность ссылки проверить не удалось, т.к. она не проиндексирована, а не то что она нерабочая...

А что в этом плохого? Все равно результаты индексации ссылок через Яндекс смотрятся, если блок закрыт от индексации, то и при проверке они покажутся как не проиндексированные.

Margo:
посмотрела....данные не из сохранненой копии - это не гуд
Nina:
Автору сервиса - на мордах и ссылки в ноиндексе бывают, вы это, похоже, не учитываете

Сервис просто показывает, что они не проиндексированы Я. Он же не ставит им "-", что означает что они не работают, а ставит "?" - проверить не удалось.

Вы считаете надо их вообще фильтровать при проверке?

Всего: 109