KupluSsilki

KupluSsilki
Рейтинг
106
Регистрация
13.07.2005

уважаемый автор программы! наблюдается такая тенденция: в большинстве случаев программа ищет по стандартной формуле первые слова с сайта, а это в основном - меню и прочие элементы навигации, в общем,...


шаблон: ((\s\S+){25})
текст: " новинкам Ужасы Ужасы, Для мобил Фильмы онлайн Свежие записи Лучшие фильмы Главная Карта сайта Тарантино мечтает о вестерне В рубриках: Новости 24.07.2009 Подписаться...

...мусор такого плана примерно.

при этом она находит, разумеется, проверяемый сайт, т.к. на нём именно такая структура.

есть рацпредложение исключить элементы навигации из текста, по которому отрабатывает регвыражение,

с целью использовать при поиске только содержимое страницы (т.е. сам текст на странице), а не навигацию.

это, например, можно сделать, если при составлении текста без тегов игнорировать короткие предложения (5 или менее слов), которые разделены тегами. (<a>о компании</a> <br> <a>наши контакты</a> <a>на главную страницу нашего сайта</a> и т.д. )

зачем это надо:

это надо затем, что на поверку большинство доноров, текст на которых неуникален,

не находятся по предложению из этого текста, т.к. "опущены". а опущенцев нам не нада.

спасибо.

п.с. имеется ввиду тот факт, что автоматическая оценка сайтов "по мусорным предикатам" довольно часто не совпадает с ручной оценкой "по содержимому". примеры в личку могу кинуть.

при этом изменить формулу, чтобы программа использовала именно связные предложения с сайта - невозможно

(слова из навигации попадают в текст, из них фактически формируется ложное предложение для поиска.

при этом отсечь, например, первые 50 слов - не панацея, т.к. количество мусора перед содержимым каждого сайта - разное. у некоторых 20 слов, у некоторых - 70 слов.)

есть даж термин специальный - "мигающие сцылки" это называется.. google такие фокусы очень не любит вроде,

с яндексом спорно.. тоже, думаю, будет далеко не в восторге...хех..

нада чтоб com net org сайты находились в яндексе. тада они считай русские - яндекс сьел, яндекс и проиндексирует всё.

как разместить статью так чтобы её никто не своровал

есть совет, братуха: размести статью в сейфе. :)

(по теме - нельзя так сделать)

Hkey:
Синомайзинг должен производиться по стандартным базам приложения

поскольку любой синонимайзер - это фактически база синонимов к нему, а не сама программа (программу-то легко написать), правильнее было бы не использовать стандартные базы, а устроить именно соревнование баз - имхо..

dlyanachalas:
Цифра 10% - с потолка взята, как я понимаю? Там сколько-то % шума. И сколько точно - неизвестно (по моим оценкам - до 50%)..

Евдокимов говорит, 4% вроде.. для троек вида A>B>C>A...

а можна узнать про 50% поподробней? (интересует, насколько большой объём анализировался.. или это тоже интуитивная такая цифра всётаки?)

вопрос обсуждающим по теме: непонятно, таки xtool этот оператор использует или нет?

(если использует то это ооочень в его пользу говорит :) ввиду последних замечаний, так сказать..)

ещё есть небольшая просьба что ли, по поводу полезности передач (многие долго идут там и непонятно смотреть/не смотреть их) - не могли бы вы пожалуйста прикрутить рейтинг к архивам, чтобы передачи можно было оценивать напр. по десятибальной шкале. спасибо..

ребят, у кого-нибудь seopult+ сэкономил что-нибудь?

ато тут Евдокимов Н. на http://seopult.tv/video/blwl/ в 16.45 объявил, что более 50% сайтов в системе вроде как перешли уже на seopult+.....

....и вроде как 17% экономии у них уже есть (а это больше чем 10% переплаты за этот режим работы)...

Wings Of Fury:
...старые ссылки всегда ценились больше новых..

ыыы старый ссылк лучше новых двух :)

кароче прогон по каталогам что-то там мож и даёт, но не сиюминутно, конечно.

но всё равно прогон имеет смысл для своих/долгосрочных проектов, и не имеет смысло для сиюминутного заработка (так всегда в общем-то и было..)

кроме того, видмо, имеет большое значение то, каким образом осуществляется прогон. по каким каталогам, с какими анкорами, по какой базе, с тематикой/без, и т.д.т.п.

кто сомневается в пользе прогона - поройтесь на форуме в ветках про прогон.

там десятки прогонщиков и прогонят ежедневно орут "прогоню! прогоню! эхх, прогоню!" :)

оне даже свою индустрию создали, хе.. качественный прогон, некачественный, базы разные там.. новые, засвеченные, белые, чёрные и т.д.. думается, всё это не на пустом месте.

dlyanachalas:
Это не рандом.
Но можно так изменить текст на страницах сайтов, что порядок изменится. Неужели до сих пор не понятно? :-/

гм.. я сег. посмотрел наконец http://seopult.tv/video/blwl/ там братэлло говорит, что можно и нужно использовать оператор "урл вертикальная чёрточка урл" (он это так называет) для отсева доноров говнистого вида, в частности - для сравнения доноров с нулёвым сайтом: в случае, если донор ниже нулевого сайта, у него знак "минус" и т.д. и т.п. такие надо убивать и т.д. и т.п.

все, кто не смотрел - на 13:20 мотайте (до этого чушь).

"этот параметр сужает базу для анализа достаточно серьёзно, примерно 20 и больше процентов можно отсечь по этому фильтру. помогает."

+ 21:30 они проводили эксперимент даже.. (ну и болото тут у нас, на сёрче..телевизор нада смотреть!! :))

Всего: 967