лепра-тасс.
пишут, что Российские самолеты отбомбились над грузинскими формированиями. Ну что, готовимся встречать пиндосов на танках?
попробуйте ответить да, а затем обосновать свой ответ :)
зы
я не знаю )
?
________________
ну ты справился, я надеюсь?
я за десятистраничники.
10 страниц.
ладно, проехали ))
ну вообще да )
хехехе )) зачот! ) Тему про бормочущие серверы слышал, да? ) или по т-мылу ностальгируешь? 😆
ыыыыы!! 😂 😂 😂
кстати, именно хорошую статью а не текст можно таки выдернуть на автомате. попробовать во всяком случае. Отталкиваться, например, от того утверждения, что хороший документ есть сеошный документ, соотв. ввести критерии на семантику, и попробовать фильтровать подобным образом. Думаю может получиться нормалек.
А про настройку под конкретные источники я тебе так скажу, что ты можешь всю ночь парсить сайт, и потом увидеть, что оказывается контент там заюзанный и непригодный, а пробники, которые ты брал до этого, ну они просто были исключением, которое не попало в индекс (хотя ты сам наверняка с подобным сталкивался).
И, если уж на то пошло, и мы говорим о ручном затачивании, то встает вопрос "а нужен ли парсер?". Я когда-то давно собирал порно рассказы, так я почти весь стульчик собрал вручную в опере минут за сорок, и этого контента хватило не на одну пачку говнотекстов. Соул соул, как говорится.
кладет! ☝
практически во всем обожусь без проксей, а где действительно надо, юзаю платные десктопные проксификаторы, которые сами базу пополняют.