LiM

Рейтинг
71
Регистрация
30.11.2001
Как писал Space
Тогда, что будет если забанят doorway1.da.ru?
Забанят ли автоматом все на www.moy_sayt.ru?
Если нет, то смогут ли вытянуть все остальные дорвеи?
Как к такому отностится Google и Yandex?

*.da.ru банить не будут. Странички же лежат на www.moy_sayt.ru, а da.ru просто их открывает во фрейме, что скрывает истиный адрес только от человека, но не от робота.

Скорее всего, модератор поисковика даже не будет знать, что эсто какой-то сайт на da.ru...

Так что забанят именно www.moy_sayt.ru.

А вытянуть все дорвеи модератору просто элементарно при таком варианте их хранения.

Как писал Nicon

А откуда появляются подозрения? Дубля страницы на другом доменном имени? Подозрение в плагиате или в нечестной раскрутке?

Дублей страницы на этом, либо другом сайте.

Судя по его заходам на наш сайт, какое-то кол-во последних проиндексированных документов хранится в кэше, а за другими документами он уже обращается на исходный сервер, если есть подозрение в дублировании (в т.ч. и плагиате) информации.

"Наказание" за такое дублирование - выкидывание из результатов поиска всех страниц с более поздней датой обновления/индексации (?)...

Фреймы - очень сильная технология, но она как приправа к еде - переложишь и вкус будет совсем не тот.

Рекомендую к фреймам подходить с правилом "если можешь не использовать, не используй". Очень много сайтов использую фреймы совершенно необоснованно, но есть такие, которые просто невозможно сделать удобными без этих фреймов.

Самое сложное - понять, где лучше не стоит думать о фреймах, а где - они только дадут выигрыш.

И еще. Как человек, который работает над сайтом из тех, что без фреймов будут неудобны, скажу, что это не самое приятное занятие на свете...

Как писал Fgorry
т.н. переменную PATH_INFO. А у нашего хостера она не выдается,
т.е. попросту пустая.

Не может быть такого... Ну просто не может и все.

Сделай скрипт такого вида


<?php
phpinfo();
?>

А потом вызови его с адресом примерно такого вида .../script.php/bla-bla-bla

Далее погляди в хвост выданной странички и ищи там описание всех переменных скрипта. Уверен, что найдеш долгожданную $PHP_INFO. Вернее, долгожданную $_SERVER['PHP_INFO']. :)

Мда... Прям как в старой фидошной шутке: "А лес (лез) такой загадочный!.. А слез такой задумчивый..."

На данный момент я в Turtle разочарован: на запрос из 5 слов, который заведомо в любом поисковике выдает мой сайт он его не выдал вообще в результатах поиска - я старательно проштудировал все результаты до конца. При этом, он умудрился выдать гору ссылок на документы художественной литературы, которая к тематике запроса не имела ни малейшего отношения. :(

Грустно, однако...

Ладно, поглядим на ситуацию в динамике - может быть они сейчас какие коэффициенты выставили с потолка, а потом будут подстраивать...

Надежда умирает последней. :)

Как писал Serjio
Подскажите, пожалуйста, каким образом сделать страницу(ы) сайта так, чтобы они индексировались поисковиком, но посетитель сайта не мог на них зайти с помощью стандартной навигации (меню сайта)?? Через маленькие прозрачные гифы? Или есть более надежные методы?

А чем "прозрачные гифы" не надежны?.. Ну, можно еще ставить просто ссылки без какого-либо текста внутри: <A HREF="..."></A> Еще могу предложить вариант с выбиранием какого-либо места, которое вряд ли заметит пользователь, и установки там обычных ссылок. Да много есть вариантов...

Первоначальное сообщение от Sad Spirit

Тут, ЕМНИП, уже выдвигалось предположение, что робот I (картиночный) выдаёт заголовок типа

Accept: image/*

Естественно при запросе документа типа text/plain (например robots.txt) и text/html (содержимое каталога) сервер отвечает ему кодом 406.

Как человек, выдвигавший то предположение, вынужден указать на неточность пересказа - тогда речь шла не про робота I, а про робота P, который и является "картиночным".

Робот I, наоборот, занимается индексированием только текстовой информации. Если бы он выдавал некорректный заголовок, Яндекс давно бы остался с пустой поисковой базой...

Тут дело не в роботе и его заголовках, а в том, что сервер не хочет по какой-то причине отдавать роботу содержимое страницы. Либо это какая-то аномалия в настройке Apache, либо неправильно написанный скрипт...

Относительно же совета с 4-мя заголовками замечу, что они чрезмерно избыточны. Достаточно любой из первых 3-х строк (лучше - 2-ю) и последней строки.

Первоначальное сообщение от Fad
Робот с клиентом D хавает, а вот с робот I не хочет.

А вот это уже странно... Робот I давно работает и уже отлажен. Значит проблема может быть только в сервере, либо в скрипте.

И дело не в том, что робот не берет документ, дело в том, что сервер ему этот документ почему-то не отдает...

А в плане Lycos.ru кто-нибудь может рассказать, как у него дела обстоят. Откуда базу берет, как хорошо ищет, много ли посетителей дает?..

Первоначальное сообщение от Pegiy
Или вы знаете способ, как будучи "постоянным клиентом" Яндекса, ускорить этот процесс?

Конечно... Вынуть из кармана зеленую бумажку. :)

На самом деле, если имеешь более одного сайта, уже есть и знания как и возможности откуда поставить столько ссылок на новый ресурс, чтобы у него быстро поднялся ВИЦ до такой высоты, что модератор Яндекса доберется до сайта относительно быстро.

Всего: 1000