lis

Рейтинг
138
Регистрация
01.08.2006
Elven:
Все немного не так, как вы себе представляете.
1. То, что у первого пользователя - человек неверно сверстал страницу и у него поехали слои и вообще какой-то кашмар с хтмл. Попросили рассказать что он сделал - повторить не может ;)
Разбираемся, как это у него получилось. Но проблема у вэб-мастера.

2. Проблема с окружными ссылками. Наш робот берет текст страницы, вырезает из него хмтл и остальное индексирует. В данном случае окружной текст сапа является текстом страницы. По-хорошему, эти блоки мастер сам должен окружить нашим тегом clx_content
Т.е. ставит ограничения на то, что надо индексировать, что не надо.
Думаем, как это решить автоматом.
Скорее всего ссылки вокруг текст считаться не будет 3-5 слов.

Как вам такой вариант? Или предложите свой вариант.

думаю что можно фильтровать блок ссылок....(не знаю насколько это ресурсоемко правда...:) или действительно не считать текстом то что в радиусе 3-5 слов....(а еще лучше задать кол-во символов исходя из саповских/ксаповских стандартов!!!!)

Klava:
Как выяснилось, я ничего не перепутала и, как ни странно, понимаю в чем суть))). Проблема имеет место быть, но это нормальный рабочий процесс - надеюсь вы быстро разберетесь.

та же проблема-размещение ссылки из околоссылочного текста саповского подвала

Вопрос к ТС: а если у меня к примеру были подкоректированы страницы, поставленны ссылки на внутренние страницы сайта??? обычное сравнение не покатит....тем более что добавляя ссылку мы изменим размер анализируемого контента и это тоже поведет к усложнению алгоритма...мое субъективное мнение: Было бы лучше если бы алгоритм определял тематичность донора и акцептора и затем накладывал/ненакладывал санкции... как сделать - очень просто...(упрощенные выводы не бейте ногами, всего лишь мнение...на паре скромных опытов) для этого нужно вывести квадратный масив (таблицу) по горизонтали тематика(т.е. столбцы-определяют тематику), по вертикали слова, на пересечении строки (слово 1, слово 2, и т.д.) и столбца (тема 1, тема 2, тема3 и т.д.), вероятность (или частотность, обозначена на рисунке "хх") появления этого слова в тексте для анализируемой тематики. таким образом с определенной вероятностью мы сможем определить схожесть семантического ядра донора и акцептора и соответственно тематичность ссылки...при этом вовсе не обязательно знать называть и определять ТЕМАТИКУ сайта в прямом смысле т.е. не обязательно давать ей человеческое название эти тематики сугубо виртуальны. по сути таким образом сравниваеться семантическая схожесть страниц. Подтвеждением моих предположений являеться то что когда я покупаю ссылку в сапе со страницы содержащей анкор ссылки и ведущей на страницу с этим словом, ссылка "РАБОТАЕТ ЛУЧШЕ" но опять таки тут много таких факторов которые не позволяют провести чистый эксперимент! см. приатаченный рисунок

jpg 9639.jpg

дайте мне приглашение плз...akim.ets(собaчкa)gmail.com

Заранее спасибо

Lapo4ka:
Нада ставить на САПЕ в фильтре поставить ПР 1

Вам показать пол-сотни каталогов с ПР>1...валом...причем веб мастера теперь перенастроили каталоги что бы ссылки стали через редирект и внешних в сапе показывает мизер, заходишь на страницу....каталог катологом....да еще и урл закрыт и что бы понять что это нужно вначале купить эту ссылку с помойки а потм удалять и ГБЛ

+1 ввести фильтрацию сайтов-площадок от каталогов.(сори открывал отдельную тему этой не видел.) уверен что многие не захотят покупать ссылки на таких мусорниках и за даром!!!

UA_Seo:
не правда, от 10 дней сроки.

ага а потом выходит вот это.../ru/forum/174158

UA_Seo:
Скорей о отсутствие Рекламных ссылок

где ?? http://www.google.com/search?num=20&hl=ru&q=%D0%BD%D0%BE%D1%83%D1%82%D0%B1%D1%83%D0%BA&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&meta= .... а тоя что то не заметил

ты про ссылки под первым сайтом....так это давно баян однако...:)

наверно яша статистику собирает по кликабельности в поиске...может потом и навсегда введет

Всего: 356