Буквально в соседней теме /ru/forum/572185 это уже обсуждается много недель, смысл в ещё одной теме?
Есть следующая идея (сразу скажу её не проверял и не тестировал) что любой ПС вычисляет для каждого домена (по ссылочному, кол-ву полезного контента, частоте обновления) некоторое суммарное время которое бот может провести на этом сайте, соответственно сколько он успеет за это время страниц выкачать, столько и проиндексирует, потом уйдет к другому. Т.е. чем быстрее сервер и чем проще с него боту получить информацию, тем больше страниц будет проиндексировано за один раз (скажем грубо говоря, если бот в США, то сервер в России будет хуже индексироваться в общем случае чем в США просто из-за времени доступа, пример дал специально утрированный). Впрочем если ПС высоко ценит этот сайт бот будет сидеть на нем максимально долго.
вполне адекватный результат, скажем если вы придете к знакомому автослесарю и спросите где лучше купить китайский джип аля Гранд Чероки, он скорее всего скажет что это отстой и лучше купить реальный, но подержанный Гранд Чероки. Т.е. на вопрос 'Где купить?' даст ответ 'Лучше купить что-то другое'.
Т.е. даже человек, а не только ПС может дать подобный ответ, на самом деле ПС всегда отражает несколько мнений скажем на запрос Калина: Калина - фигня и Калина - нормальная машина и вопрос какое мнение будет в выдаче зависит именно от пользователей и СЕО продвигающих запросы, а не от ПС.
попробуйте команды ping и tracert для первого и второго сайта и сравните результаты.
вообще могут быть проблемы с фаерволом, файлом hosts, вирусами и интернетом.
Да кстати после того как правили hosts сбрасывали ipconfig /flushdns? Попробуйте сбросить.
А сайт с выделенным ип? Или на ВДС? Если нет то обращение по ип именно на страницу хостера и приведет.
Проблемы ИМХО с ДНС вашего провайдера/компьютера, попробуйте походить по другим сайтам (только не супер популярным типа гугла и майла) такого не бывает? Вообще есть полно сервисов простукивающих сайт с разных серверов, попробуйте их + можете использовать прокси сервер чтобы попасть на свой сайт.
Cудя по первому посту ТС именно об этом, понятно что совсем от рекламы никуда не уйти (ну кроме продажи ссылок, которая тоже не сильно приветствуется ПС), но вот когда основную часть страницы закрывает банер который никак нельзя убрать даже кликнув на него это уже перебор, ИМХО.
дубль пред. сообщения
Санкций не бывает даже за то что вы при заходе пользователя с ПС определяете по какому запросу он зашел на сайт (по референсу) и отправляете на правильную по вашему мнению страницу, а не ту которую определил поисковик (бывает нужно когда ПС глючит и отправляет по запросу на совсем левую страницу, где мало полезной информации, например вместо страницы статьи, на главную, где есть только название и краткое описание статьи). По крайне мере у меня такой трюк давно работает.
Какую ссылку? header("Location: admin.php"); exit(); это серверный редирект средствами php, там нет никаких ссылок.
Вот нашел в архиве форума про размер страниц в индексе гугла , увы конечно 5 лет назад это ну ооочень давно для ПС (там сошлись на 500 Кб максимальный размер для гугла), вот есть английская версия от 2008 года http://www.webmasterworld.com/google/3693423.htm, в ней говорится что имеет значение не только сам размер, но и скорость возврата страницы и PR страницы и сайта, но тоже около 600 кб наибольший размер после которого гуглбот может начать игнорировать часть страниц.
WhiteSmartFox добавил 08-12-2010 в 18:36
Я себе представлю это так ПС определяет ссылочную массу сайта, время домена и т.п. признаки качественности сайта и от этого вычисляет некоторый бюджет времени которое может потратить бот на этом сайте после которого он уйдет к другому, соответственно бот может выкачать 1000 маленьких страниц за это время или 10 больших (конечно ещё имеет значение скорость генерации страницы и ответа сервера). Если у сайта заоблочный ТИЦ или PR бот выкачает с сайта все что можно, а вот если маленький, то сколько получится (иначе не было бы тем почему Яндекс выкачал 10% от сайта и дальше не хочет индексировать).