палю тему проверка беков на трастовость

S
На сайте с 25.11.2007
Offline
143
#101

NeoSky, чтобы убрать меню поставьте галку на "удалять тэги a"

3-5 предложений яндекс находить не будет, если все-таки хотите, то для этого надо всего-лишь увеличить число 20 в стандартных шаблонах

sapien добавил 13.10.2009 в 19:44

feligz, присутствие в индексе и нахождение "под фильтром" разные вещи...

понимайте "под фильтром" как "забанен"

rpuwa
На сайте с 17.03.2007
Offline
65
#102

очень нужна скорость вашей программке (многопоточность, прокси, еще что-то)

Наш герой Гриша: "С возвращением, серч!"; «Сначала тебя игнорируют, затем над тобой смеются, затем с тобой борются, затем ты побеждаешь» (с)М. Ганди
S
На сайте с 25.11.2007
Offline
143
#103

прокси подхватывается из настроек IE

KupluSsilki
На сайте с 13.07.2005
Offline
106
#104

афтар помогите! :)

опять небольшие проблемы с мусором следующего плана:

формула (\s\S\S+){20} (это 20 слов длиной 2 или больше непробелов каждое)

иногда не цепляет ни одного предложения даже в длинном тексте из-за того,

что в среднестатистических предложениях почти всегда есть предлоги длиной в 1 символ.

а придумать формулу, которая содержала бы 20 слов длиной 2+,

и ещё 2-3 предлога в разных местах промеж этих слов,

никому покамест не представляется возможным из моих знакомых программёров.

(а так же и для регвырщиков с weblancer.ru.)

хотя именно эта формула описывала бы идеальное "стандартное_предложение_из_русского_языка".

интересует вопрос что вы думаете по этому поводу.

пасибо.

бриллиантовые руки (http://www.forweb.ru/бриллиантовые_руки) не наш удел, у нас - деревянные )
S
На сайте с 25.11.2007
Offline
143
#105

KupluSsilki, а если такой: (\s\S+){20}

будет искать любые слова

могу добавить вырезание символов пунктуации, чтоб на выходе были только буквы и цифры

Юрий-Михалыч
На сайте с 02.10.2009
Offline
73
#106

посмотрим...

Быстрый охват в соц сетях на 1 млн пользователей Контакт по 10 коп (http://911-seoweb.ru/novosti/Buzzcraft/)
KupluSsilki
На сайте с 13.07.2005
Offline
106
#107
sapien:
KupluSsilki, а если такой: (\s\S+){20}
будет искать любые слова

эта формула (20 слов из одной или нескольких букв) тоже есть в стандартных предложенных,

на практике пробовали юзать, она очень часто выбирает мусор до начала осмысленного текста.

(выбирает напр. 20 слов длиной ровно одну букву :))

вторая формула на практике работает гораздо вернее. если бы не было погрешностей из-за присутствия предлогов, выбирала бы совсем точно..

чуть позже примеры приведу... да вот хотя бы, страница с форума:

/ru/forum/395622

шаблон: ((\s\S+){20})

текст: " » / | | | | | | | | палю тему проверка беков на трастовость Имя Запомнить? Пароль К" (20 слов)

шаблон: ((\s\S\S+){20})

текст: " Делаю баннеры GIF Регистрация: 01.08.2009 Сообщений: 199 Репутация: -2707 Ответ: палю тему проверка беков на трастовость спасибо щас качну __________________" (20 слов)

второй вариант точнее. а у первого мусор в начале.

NeoSky
На сайте с 18.01.2008
Offline
172
#108

Я когда парсил текста, делал регулярку такого плана:

Первая буква заглавная, слова где есть русские буквы, точка в конце

потом проверял длину предложения, короткие отбрасывал.

Из кожи вон, но лезу в ТОП
KupluSsilki
На сайте с 13.07.2005
Offline
106
#109
NeoSky:
Я когда парсил текста, делал регулярку такого плана:
Первая буква заглавная, слова где есть русские буквы, точка в конце
потом проверял длину предложения, короткие отбрасывал.

друже, можешь выражение кидануть сразу а? ато я вот не силён в регвырах.. :(

NeoSky
На сайте с 18.01.2008
Offline
172
#110

Да мне не сложно, но они неправильно работают в программе

/[А-Я].+?(\.|\?|!)/s

А в том виде что у ТС в программе я не силен

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий