думаю что можно фильтровать блок ссылок....(не знаю насколько это ресурсоемко правда...:) или действительно не считать текстом то что в радиусе 3-5 слов....(а еще лучше задать кол-во символов исходя из саповских/ксаповских стандартов!!!!)
та же проблема-размещение ссылки из околоссылочного текста саповского подвала
Вопрос к ТС: а если у меня к примеру были подкоректированы страницы, поставленны ссылки на внутренние страницы сайта??? обычное сравнение не покатит....тем более что добавляя ссылку мы изменим размер анализируемого контента и это тоже поведет к усложнению алгоритма...мое субъективное мнение: Было бы лучше если бы алгоритм определял тематичность донора и акцептора и затем накладывал/ненакладывал санкции... как сделать - очень просто...(упрощенные выводы не бейте ногами, всего лишь мнение...на паре скромных опытов) для этого нужно вывести квадратный масив (таблицу) по горизонтали тематика(т.е. столбцы-определяют тематику), по вертикали слова, на пересечении строки (слово 1, слово 2, и т.д.) и столбца (тема 1, тема 2, тема3 и т.д.), вероятность (или частотность, обозначена на рисунке "хх") появления этого слова в тексте для анализируемой тематики. таким образом с определенной вероятностью мы сможем определить схожесть семантического ядра донора и акцептора и соответственно тематичность ссылки...при этом вовсе не обязательно знать называть и определять ТЕМАТИКУ сайта в прямом смысле т.е. не обязательно давать ей человеческое название эти тематики сугубо виртуальны. по сути таким образом сравниваеться семантическая схожесть страниц. Подтвеждением моих предположений являеться то что когда я покупаю ссылку в сапе со страницы содержащей анкор ссылки и ведущей на страницу с этим словом, ссылка "РАБОТАЕТ ЛУЧШЕ" но опять таки тут много таких факторов которые не позволяют провести чистый эксперимент! см. приатаченный рисунок
дайте мне приглашение плз...akim.ets(собaчкa)gmail.com
Заранее спасибо
Вам показать пол-сотни каталогов с ПР>1...валом...причем веб мастера теперь перенастроили каталоги что бы ссылки стали через редирект и внешних в сапе показывает мизер, заходишь на страницу....каталог катологом....да еще и урл закрыт и что бы понять что это нужно вначале купить эту ссылку с помойки а потм удалять и ГБЛ
+1 ввести фильтрацию сайтов-площадок от каталогов.(сори открывал отдельную тему этой не видел.) уверен что многие не захотят покупать ссылки на таких мусорниках и за даром!!!
ага а потом выходит вот это.../ru/forum/174158
где ?? http://www.google.com/search?num=20&hl=ru&q=%D0%BD%D0%BE%D1%83%D1%82%D0%B1%D1%83%D0%BA&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&meta= .... а тоя что то не заметил
ты про ссылки под первым сайтом....так это давно баян однако...:)
наверно яша статистику собирает по кликабельности в поиске...может потом и навсегда введет