Изначально - совместно, а уж если решат развести, то начнут считать раздельно.
И те, для кого тИЦ считается раздельно (хотя в ЯК не состоят)
нет. поводов для санкций просто нет. Если зеркальщик не счиает их полными зеркалами, то все ок.
Владимир-C,
Разработка ссылкообменного/каталожного скрипта требует 4-5 дней, если нужно мониторить бэки.
Зачем повторно ходить по граблям, по которым кто-то уже прошел.
semenov,
Если броузер его видит, значиимт не все так плохо.
Что Вы в нем такого невалидного нашли.
- нет стандартного заголовка
- мета и стили стоят по тексту
- титл не там
Да еще все это внутри текст-ариа. Что в этом страшного. (http://validator.w3.org/check?uri=http%3A%2F%2Fnovalid.ssve.ru%2F)
Ошибок, которые не позволят парсеру пройти текст - нет.
Ведь индексатор смотрит на хтмл как на разметку. Он то его прошел. Вопрос, что он с него воспринял, какие веса присвоил, и как отреагировал на ссылки с него.
DIMON-UA,
Это, с вероятностью ~70-80% можно сделать
За что? и из чего следует?
С биржами не работал и не собираюсь. Ибо сама их суть противоречит разуму.
А на счет тормозов, здесь есть 4 составляющих.
1. Отклик сервера.
2. Отклик биржы.
3. Получени и запуск внедренного пхп(тормоз по факту).
4. Яшино отношение к бирже (код биржи, чаще всего, узнаваем.)
Вот поэтому и не юзаю такое.
В общем приближении да. Не могу точно гарантировать именно 3 сек, может 2, а может - 5. Но порядок именно такой.
Если у Вас такая торозная база, - то нужно решать проблемму с программерами.
Если бот не может дождаться ответа, то и некоторые юзеры тоже. Вы посмотрите на скорость генерации страниц хотябы этим форумом.(внизу страницы). Коенчно стоит проверить еще прохождение пакетов от вас до яши.
Некоторые криворукие админы хот-платформ зажимаю канал для ботов.
Lestor_SB,
Давайте тогда по очереди.
пишу(утрированно) протокол общения клиента (робота, юзера "К") и сервера ("C") по протоколу HTTP 1.1 (некоторые боты ходят с 1.0)
1. К - GET ...... (запрашивается страница и передаются стандатрые параметры - имя агента, куки, и т.д.)
2. C - Создает сокет для подключения, видиляет виртуальную сессию, принимает данные, запускает виртуальный процесс.
3. C - 200 ..... (стандартный ответ сервера с заголовком ответа)
4. С - блок данных
5. К - Клиент подтверждает получение и становится в ожидание следующего блока.
Пункты 4-5 повторяются, пока блок не закончится значением 0.
Так вот, тайм оут, который указан в соединении, это ожидание между каждым из блоков получения/передачи.
А общая длина, какраз и определяется параметром 30 или 60 сек.
А вот параметры ожидания блока, определяютя, чаще всего, параметром сервера. Как долго он держит текущую сессию.
Бот же будет ждать разумное время, т.е. не более 3 000 мсек. Т.к. для TCP/IP сетей, это наиболее частый параметр.
Все изложенно в наиболее общей форме.