http://www.yandex.ru/yandsearch?Link=www.site.ru/page.html&numdoc=50&rd=0
И погнали софтинкой все свои страницы прокатывать (кроме тех, на которые явно нет ссылок)
Я так всегда стат веду своим софтом.
Посмотри модреврайтовские сайты. Я сначала кинулся смотреть что народ пишет, и не вижу никакой зависимости, а потом на одном своем смотрю - выстроились в рядок как положено по накаченности. Я давай думу думать - почему этот так показзывается, а остальные нет? Потом догнал - ссылки все .html и названия страниц осмысленные. Проверил 5 к 5 .php .html - на всех реврайтовских оказалось стоят рядком по крутизне, а на .php - нет.
Но крутизна не ВИц по идее, а накачанная ссылками, плюс внутренними, сильно выше чем остальные, плюс они как правило есть первые от главной. Трудно сделать вывод что это такое, но что есть то есть.
Господа, о каких бэках может идти речь, если индексатора на сайтах почти нет. Вместо него быстробот пробегает, хапая в 45 раз меньше страниц чем индексатор, но вот по линкам он не идет зараза.
У меня на пяти порталах, которые индексились каждые 12-25 минут индексатором, и любая добавленная ссылка индексилась в среднем за 4 часа, теперь только быстробот пасется, а новые ссылки вообще не подхватывает, только с морд.
Поэтому, какие могут быть бэки?
По логам он их не отличает, его в логах можно только предположительно вычислить.
Я у себя тоже заметил, что яшин бот стал пастись только на определенных страницах в последние дни, при этом, абсолютно не следует ссылочному на этих страницах, а постоянно сканит одни и те же, которые между собой никаким боком, но именно они являются постоянно изменяющимися (каждые 3-6 часов).
Так вот я тоже подумываю, что это не основной индекстатор у меня ползает, а быстробот поддерживает оперативность информации с сайтов.
Раньше, индексатор более-менее соблюдал ссылочное на страницах, по которым бродил (да и страниц этих он брал не в пример больше за раз).
Правые ссылки - еще один трудный момент в вашей системе. Фильтры. Я не смогу писать постоянно сотни слов (да и собирать такую статистику не собираюсь) чтобы отфильтровать порно эро знакомства сайты. Система (как сапе) должна иметь встроенный и жестко контролируемый фильтр таких сайтов, который я могу либо включить, либо нет.
Как разнести ссылки по странице? Вы что думаете я буду блоками ваши левые ссылки размещать на сайтах?
Price.ru ресурс уровня страны, а не организации. Microsoft его рекомендует при установке IE7 и на их сайте как поисковый движок он в списке.
Тут не в трафе дело, на таких сайтах уже дело в пополнении информации и удобстве ее поиска для пользователей. Раскручивать такие ресурсы не нужно. Когда то международный ресурс (китайцы владельцы) алибаба начинал как обычная доска (я с них пример брал и параллельно мы шли по международным объявлениям) а теперь они свои акции продают на миллионы долларов и тот же микрософт им дал грает (а заодно и акций выкупил) 4 миллиона долларов на развитие их ресурса дальше.
Так что делайте выводы по продвижению таких ресурсов.
McKane - нет нет, пошло пошло. До этого стопор был конкретный, а теперь полезли у меня и в кампаниях и на сайтах.
Про сапу и ксапу - это абстрактно (так как они в данный момент самые популярные).
Речь о всех системах продажи в целом.
И ответ на все системы вцелом - никак нельзя определить со стопроцентной вероятностью кроме как через сами системы изнутри.
Может яндекс и думает о том как отловить алгоритмически, но что при этом достаточно большой процент сайтов ошибочно зафильтруется - это гарантированно.
Dnn - Никогда и никто не сможет узнать какие папки у вас на сервере (если вы не тормознули и забыли запретить вывод листинга каталогов при отсутствии запрашиваемой страницы), тем более, какие файлы в этих папках.
egosoccer - У меня 60% сайтов с динамическим кодом системы собственной рекламной открутки. Все ссылки, кнопки, банеры показываются согласно правилам крутилки - это что сапе или ксап должен быть по вашему алгоритму?
Время модификации страниц - все мои страницы php отдают что изменилась 45 минут назад (собственные динамические крутилки, генераторы контента из базы и новостные движки подтверждают эти изменения, никогда страница не будет одинаковой даже если смотреть через секунду, объем соответствено тоже).
Никак вы не узнаете что это ссылки сапы и ксапы, кроме как влезть в саму систему и там отлавливать.
egosoccer, Dnn - не зачет.