pelvis, а какие теги считаются начальными и конечными? По какому принципу отбираются? Можете на примере какой-нибудь страницы показать? :)
Мдя, похоже, я не с того конца подошёл к проблеме...
Тогда не скажете, где почитать, как работает типичный парсер? То есть, что он делает с html-страницей, конкретно?
P.S.: Я не глупый... и гуглем пользоваться умею... просто никогда раньше с этим дела не имел, и не знаю откуда начать :o
LEOnidUKG, переформулирую: осложнить работу парсеру, убрав повторяющиеся элементы со страницы, в частности - названия стилей.
KM.UA, а как определяется, что такой-то кусок кода содержит текст, а такой-то - меню?
Админка -> Все меню -> собственно меню -> создать новый пункт -> Материалы -> Шаблон списка категории -> Сохранить.
На пункт меню повесить сразу список статей. В чём проблема-то?
Технически нереализуемо - чтобы в потоковом режиме простерилизовать ультрафиолетом эти пол-литра вдыхаемого воздуха, плотность излучения должна быть просто запредельной. Плюс проблемы с охлаждением, питанием, защитой человека от излучения... это примерно два автомобиля будет - на одном стерилизационная камера, на втором - дизельный генератор :)
+называть это устройство маской - некорректно. Маска защищает не того, кто её носит, а всех остальных от того, кто её носит. Тут же предлагают респиратор какой-то... стерилизационный :)
В программе не работает сравнение текущих результатов с результатами проверки, сделанными 13 числа и раньше (до обновления программы, судя по всему)... :o
Перемещать все неактуальные страницы в раздел "архив", на страничке крупным шрифтом выводить "Это архивная страница, информация на ней неактуальна, можете перейти на..." и дальше - ссылки на главную страницу, на главные разделов, на похожие статьи, на последние статьи в той же категории.
Проще, наверное, попросить отписаться тех, кому она НЕ нужна :)
Было бы очень неплохо, если бы программа умела собирать статистику и строить графики доход/расход, желательно не только по системам, но и по сайтам, рекламным блокам, etc.
http://browsershots.org/