Нет, не боюсь я. Одной статьи на блоге - очень мало, чтоб что-то изменить. А по теме - я тоже вначале отнесся к статье и заниням автора скептически, но :
Текст (URL) ссылок нужен только для ранжирования, но никак не для индексации. К тому же текст ссылок имеет достаточно маленький вес.
Каждый робот имеет параметр "глубина индексации", а так же параметр кол-ва страниц на сайт.
Робот заходит на сайт со страниц, на которые стоят внешние ссылки. Начиная с этих страниц он в несколько подходов индексит остальные страницы в иерархии сайта. Глубина обычно 1-2 страницы. В конце концов он доберется до самой далекой страницы, но на это уйдут недели. Если ты хочешь, чтоб у тебя все страницы были проиндексированы, то тебе нужно создать карту сайта, со всеми страницами, и сделать на нее ссылку с каждой страницы сайта. Либо второй вариант (что больше применимо к гуглю) - разместить карту сайта на другом ПР-истом ресурсе (достаточно пр-а 1-2).
Второй момент это количество страниц на домен. Поисковики имеют лимиты кол-ва страниц на домен. В гугле, для ПР4 это 150 тысяч страниц, и больше он не будет "кушать". Чтоб эту проблему решить нужно сгруппировать страницы по тематике, и вынести их на сабдомены.
Perl?
Ищи парсеры, либо софт, работающие на EXPAT. Он гораздо более быстрый т.к. работает с потоком данных, без постройки дерева в памяти. То, что у тебя висло - скорее всего работает на SAX2 - он более "навороченный", но и в десятки раз более медленный.
п.с. 1 гиг - это не проблема. Проблемы с объемом данных начинаются после 2 гигабайт.
У меня карта есть. Все просто.
Как-то разговаривал с хостером по поводу разных подсетей. Резюме было следующим : сетку получить очень геморройно.
Гораздо дешевле и экономичнее - брать платные хостинги дешевые. Как раз получатся разные подсети + дешевле по сравнению с покупкой даже класса С.
Иконки - очень полезная вещь. Человек в первую очередь воспринимает образы. Если иконки будут гармонировать с тематикой сайта - это даст +5 сайту, и сделает его запоминающимся.
Насчет загрузки иконок - используйте кеширование. Они будут загружены один раз у каждого пользователя, и в дальнейшем будут показываться из кеша броузера.
Работа налоговой тоже стоит денег. Работа по вашему вопросу стоит N-ую сумму денег в виде зарплат и прочих издержек. Если возможная прибыль (штрафы), либо сумма ущерба в виде неуплаты налогов не превышает, то вы никому не нужны.
Одна из лучших CMS которыми пользовался, если не лучшая. Раньше я работал бесплатными CMS, но попробовав Netcat, забыл напрочь о бесплатном сыре!
Я могу. Пиши в личку.
Можно на PHP наваять скрипт, который будет напрямую в MX-ы слать, а не через рилей хостера. Уверен, что на php.net есть примеры.