У меня их четыре :)
Попробую, спасибо. Хотя похоже, что не жрет, сволочь. Зажимает малые народы :(
Так вы указали сайт на двух языках. А тут почти ни одного русского слова.
В общем да. Контент - фольклор, старые советские газеты. Очень интересно, для тех кто понимает.
Попадает, если вы на поддоменах втюхиваете туфту, с целью обмана поисковой машины. Это единственный критерий нарушения лицензии.
У меня несколько сайтов на которых от трех до тридцати поддоменов зарегистрированы в качестве самостоятельных в Я-каталоге. Причем часть из них занесена бесплатно модераторами Яндекса.
Если в этом разделении есть здравый смысл то нормально будет. Если сайт очень большой, то есть еще выигрыш в скорости переиндексации контента. Но лучше разнести не на поддомены, а на отдельные домены. Не все соглашаются меняться ссылками с доменами третьего уровня.
Выполняйте один раз при загрузке новости. Только не str_replace, а eregi_replace. В последнем случае можно еще и словарные окончания ловить.
>1) Чем промышляли до столкновения с этим форумом?
Тем же чем и сейчас. Веб-мастер всяких разных сайтов. Профессиональным оптимизатором не стал - хлопотное и нервное это дело. Ну и вообще не мое.
> 2) Сколько времени вы читали этот форум? Ну тоесть через какое время
> вся куча информации устаканилась у вас в голове и все разложилось
Попал в 2001. зарегистрировался в январе 2002 под логином savel,
Основное за полгода. А вообще до сих пор не уложилось :) Достаточно много случайных элементов, противоречивых требований, неизвестных переменных.
1. В роботсе можно прописать подсказку для Яндекса о том что сайт с www и без www одно и то же. В этом случае склейка зеркал произойдет быстрее со всеми вытекающими последствиями.
2. Роботов очень много. Каждый из них прежде чем залезть на сайт, ищет robots.txt . При его отсутствии в логах регистрируется ошибка. Таких ошибок может быть несколько десятков на день. Из-за них вы может пропустить критическую программную ошибку, попытки хака, неизбежные мелкие недоработки типа кривых линков, отсутствующих картинок и т.п.
Кстати по причине п.2 рекомендуется держать favicon.ico
Типовая ошибка растиражированная инструкцией Яндекса для веб-мастеров :)
Правильно: User-agent
см. http://www.robotstxt.org/wc/faq.html
Впрочем, регистр агента ни на что не влияет. Но чекер http://tool.motoricerca.info/robots-checker.phtml обязательно в вас плюнет.
Если его не заводить роботы будут загаживать логи 404 ошибкой. Вам это надо?
Интересно, когда начнется волна переделок CMS под XML+XSLT?
Hе делили мы тебя и не лaскaли,
А что любили, тaк это позaди.
Я в душе ношу твой светлый обрaз, Вaля,
А Лешa выколол твой обрaз нa груди.
И в тот день, когдa прощaлись нa вокзaле,
Я тебя до гробa помнить обещaл.
Я скaзaл, - я не зaбуду в жизни Вaли!
- А я тем более!, - мне Лешa отвечaл.
А теперь реши, кому из нaс с ним хуже,
И кому трудней, попробуй рaзберись.
У него твой профиль выколот снaружи,
А у меня душa исколотa снутри.
...................................................