Я за одну БД. У нас тоже сайт на битриксе. А точнее основной сайт и поддомены (их много). Можно сказать Ваша ситуация. Общая посещаемость около 6000 уников в сутки (или 60000-70000 тысяч хитов вместе с поисковиками). Страницы открываются моментом. Среднее время генерации страницы - 0.1 сек. (а на некоторых страницах и 0.05 сек.). Загруженности сервер ни какой не испытывает. Все это я говорю к тому, что по-моему лучше настроить нормально mysql сервер и работать спокойно на одной БД. Потом уже когда количество уников будет измеряться в десятки тысяч, можно будет и подумать над увеличением производительности путем раздвоения БД. А сейчас по мне так не забивайте себе голову))
Может это?
preg_match_all("'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1) (.*?)\\1 | ([^\s\>]+))'isx", $html, $urls);
Ну, как и предполагал, сколько людей, столько и мнений. Но все же некоторую информацию для себя я почерпнул)))
При чем здесь это? Я не собираюсь скупать доменные имена в .ru, .by, .ua чтобы быть представленным в регионе. Я собираюсь построить проект в одной доменной зоне. Ведь сайта searchengines.by или searchengines.com или searchengines.ua нет? Он себе сделал имя в .ru ведь. Тот же подход и у меня. У меня не сайт производителя чего-либо. Это информационно-аналитический портал. И мне необходимо чтобы мой проект у пользователей ассоциировался с ОДНОЙ доменной зоной, а не двумя, тремя, четырьмя...
krotov.dima добавил 25.01.2011 в 16:22
Уважаемый, а Вам что, так глаза мозолит моя тема?
Под своим сообщением я имел ввиду не русскоговорящих пользователей в Японии и Гондурасе, а бывшие советские республики. Да и то не все, а только Россия, Беларусь, Украина (основные).
Проект будет исключительно для русскоговорящих пользователей.
Уважаемый, читайте мой ответ выше ))))
Ох болван я. Похоже разобрался. Только вот вопрос о макс значении crawl-delay остается открытым. По остальным вопросам разобрался. Ошибся я в расчетах.
krotov.dima добавил 11.01.2011 в 16:17
Не исключено! Знаете, мы тут перестали удивляться абсурду)))))))
С радостью сменили бы, если бы не одно НО))) Наш сервер живет в Беларуси. А там по указу президента, все ком сайты должны располагаться на серверах Белтелекома. А у них внешний трафик платный, около 1.3$ за Гб. Поэтому и ищу решение проблемы.
Сейчас поставил запрет на индексацию всех картинок на сайтах. А можно ли настроить так, чтобы бот ходил только по новым страницам (где-то тут похожая тема проскакивала, правда давно уже)?
krotov.dima добавил 11.01.2011 в 16:03
Стоит уже давно. У нас ВПС.
Уважаемый mlsha!
Просьба писать Вас по теме (тема топика в первом сообщении), а не засорять топик всяким бредом. Специально для Вас поясню, "мощный и трастовый портал" уже как года 3 существует. И он самый лучший в своем регионе. Продажи и покупки бизнеса на этом сайте не редкость. Далеко не редкость, как Вам хочется это представить. При подаче объявления о продаже бизнеса, человеку предлагается рекламный набор услуг. Это выделение в каталоге, размещение в топе, реклама в виде баннеров и т.д. И вот когда такому человеку предлагается разместиться на платной основе, с рекламой о продаже его бизнеса не только на сайте site2.site1.com, но и на site3.com, то его это намного больше заинтересует. Дополнительный плюс всех этих сайтов в том, что будут приходить больше людей, заинтересованных в тематике сайта, а соответственно и быстрее совершится операция продажи/покупки.