vitio

vitio
Рейтинг
30
Регистрация
14.03.2009
Dub Rat:
Content Downloader?
юзаю сам, правильно настроив будет без мусора парсить.

Желательно софт крякнутый или фришный)))

vitio добавил 09.09.2010 в 23:13

quickmouse:
В подписи, парсишь, чистишь, радуешься)

Аналог sibir textmaker?)))

vtomas:
Если требуется жесткий перенос из html в txt (на выходе только текст, без единого тега) то прога иероглиф (Hieroglyph) загляни в меню "конверсия"- "html в текст".

Hieroglyph способн отделить текст от остальных блоков страницы?

Kasperzzz:
vitio, используйте нормальные парсеры.

к примеру?

Kasperzzz:
vitio про какой мусор идёт речь? Нормальные парсеры выдирают чистый текст, если руки откуда надо.
Или вы про мусор в сканах говорите?

Граблю с помощью webgrabber или sibir textmaker. После грабинга пергоняю все в txt для использования для доргена. В тексте получается много мусора в виде:

лишние пробелы

$quote и т.д.

bolyk:
Там в конфиге пропиши адресс к твоему скрипту. И все заработает.

Конечно большое спасибо за ответ))) Но проблема решалась проще))) Видно textmaker сделн под php 5.2 у меня стоял php 5.3 . Поставил 5.2 и все заработало☝

Zapata:
Разделом не ошиблись?

Совсем нет)))

На какую тему магазин и какая именно нужна помощь?

true-NuB:
А еще лучше 100 или 10 симвлов, и обязательно делайте так.
Ведь незнакомые люди, никогда не посоветует ничего плохого и глупого.

Если на то пошло, так какой объем текста лучше взять на пагу?

Я в основном придерживаюсь 2000 символов.

Pri4ina:
1000 - 2000 символов для любого поста на доре, больше и не нужно.

Возьму на ум заметку:)

serhioz89:
используй http://iphoster.ru/ и будет тебе счастье, скупой платит дважды

за айпихостер я слышал, только никак не добрался до него. теперь буду пробовать юзать:)

Всего: 89