T.R.O.N

T.R.O.N
Рейтинг
314
Регистрация
18.05.2004
Sonja:
тИЦ для всех субдоменов отдельно считается, если они не явл. зеркалами конечно.

Изначально - совместно, а уж если решат развести, то начнут считать раздельно.

Sonja:
для остальных -- это один ресурс в выдаче
Sonja:
Исключением считаются субдомены описанные в ЯКе

И те, для кого тИЦ считается раздельно (хотя в ЯК не состоят)

MyOST:
стуком в саппорт, что по одному запросу домен и сабдомен с 1 инфой

нет. поводов для санкций просто нет. Если зеркальщик не счиает их полными зеркалами, то все ок.

Владимир-C,

Разработка ссылкообменного/каталожного скрипта требует 4-5 дней, если нужно мониторить бэки.

Зачем повторно ходить по граблям, по которым кто-то уже прошел.

semenov,

Если броузер его видит, значиимт не все так плохо.

Что Вы в нем такого невалидного нашли.

- нет стандартного заголовка

- мета и стили стоят по тексту

- титл не там

Да еще все это внутри текст-ариа. Что в этом страшного. (http://validator.w3.org/check?uri=http%3A%2F%2Fnovalid.ssve.ru%2F)

Ошибок, которые не позволят парсеру пройти текст - нет.

Ведь индексатор смотрит на хтмл как на разметку. Он то его прошел. Вопрос, что он с него воспринял, какие веса присвоил, и как отреагировал на ссылки с него.

DIMON-UA,

DIMON-UA:
* место использования интернета (дом / работа / дом&работа)
* наличие широкополосной связи дома / на работе

Это, с вероятностью ~70-80% можно сделать

Гор:
вот у провайдера вирт сервер и на одном ИП куча Сайтов
это чего получаеться что если вдруг..... то яндекс пожет забаниТь?

За что? и из чего следует?

Lestor_SB:
По каждой бирже есть теперь "понятки"

С биржами не работал и не собираюсь. Ибо сама их суть противоречит разуму.

А на счет тормозов, здесь есть 4 составляющих.

1. Отклик сервера.

2. Отклик биржы.

3. Получени и запуск внедренного пхп(тормоз по факту).

4. Яшино отношение к бирже (код биржи, чаще всего, узнаваем.)

Вот поэтому и не юзаю такое.

Lestor_SB:
Из вашего ответа я так понял 3000 мсек. Я правильно понял?

В общем приближении да. Не могу точно гарантировать именно 3 сек, может 2, а может - 5. Но порядок именно такой.

Если у Вас такая торозная база, - то нужно решать проблемму с программерами.

Если бот не может дождаться ответа, то и некоторые юзеры тоже. Вы посмотрите на скорость генерации страниц хотябы этим форумом.(внизу страницы). Коенчно стоит проверить еще прохождение пакетов от вас до яши.

Некоторые криворукие админы хот-платформ зажимаю канал для ботов.

Lestor_SB,

Давайте тогда по очереди.

пишу(утрированно) протокол общения клиента (робота, юзера "К") и сервера ("C") по протоколу HTTP 1.1 (некоторые боты ходят с 1.0)

1. К - GET ...... (запрашивается страница и передаются стандатрые параметры - имя агента, куки, и т.д.)

2. C - Создает сокет для подключения, видиляет виртуальную сессию, принимает данные, запускает виртуальный процесс.

3. C - 200 ..... (стандартный ответ сервера с заголовком ответа)

4. С - блок данных

5. К - Клиент подтверждает получение и становится в ожидание следующего блока.

Пункты 4-5 повторяются, пока блок не закончится значением 0.

Так вот, тайм оут, который указан в соединении, это ожидание между каждым из блоков получения/передачи.

А общая длина, какраз и определяется параметром 30 или 60 сек.

А вот параметры ожидания блока, определяютя, чаще всего, параметром сервера. Как долго он держит текущую сессию.

Бот же будет ждать разумное время, т.е. не более 3 000 мсек. Т.к. для TCP/IP сетей, это наиболее частый параметр.

Все изложенно в наиболее общей форме.

Всего: 4849