- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
NeoSky, чтобы убрать меню поставьте галку на "удалять тэги a"
3-5 предложений яндекс находить не будет, если все-таки хотите, то для этого надо всего-лишь увеличить число 20 в стандартных шаблонах
sapien добавил 13.10.2009 в 19:44
feligz, присутствие в индексе и нахождение "под фильтром" разные вещи...
понимайте "под фильтром" как "забанен"
очень нужна скорость вашей программке (многопоточность, прокси, еще что-то)
прокси подхватывается из настроек IE
афтар помогите! :)
опять небольшие проблемы с мусором следующего плана:
формула (\s\S\S+){20} (это 20 слов длиной 2 или больше непробелов каждое)
иногда не цепляет ни одного предложения даже в длинном тексте из-за того,
что в среднестатистических предложениях почти всегда есть предлоги длиной в 1 символ.
а придумать формулу, которая содержала бы 20 слов длиной 2+,
и ещё 2-3 предлога в разных местах промеж этих слов,
никому покамест не представляется возможным из моих знакомых программёров.
(а так же и для регвырщиков с weblancer.ru.)
хотя именно эта формула описывала бы идеальное "стандартное_предложение_из_русского_языка".
интересует вопрос что вы думаете по этому поводу.
пасибо.
KupluSsilki, а если такой: (\s\S+){20}
будет искать любые слова
могу добавить вырезание символов пунктуации, чтоб на выходе были только буквы и цифры
посмотрим...
KupluSsilki, а если такой: (\s\S+){20}
будет искать любые слова
эта формула (20 слов из одной или нескольких букв) тоже есть в стандартных предложенных,
на практике пробовали юзать, она очень часто выбирает мусор до начала осмысленного текста.
(выбирает напр. 20 слов длиной ровно одну букву :))
вторая формула на практике работает гораздо вернее. если бы не было погрешностей из-за присутствия предлогов, выбирала бы совсем точно..
чуть позже примеры приведу... да вот хотя бы, страница с форума:
/ru/forum/395622
шаблон: ((\s\S+){20})
текст: " » / | | | | | | | | палю тему проверка беков на трастовость Имя Запомнить? Пароль К" (20 слов)
шаблон: ((\s\S\S+){20})
текст: " Делаю баннеры GIF Регистрация: 01.08.2009 Сообщений: 199 Репутация: -2707 Ответ: палю тему проверка беков на трастовость спасибо щас качну __________________" (20 слов)
второй вариант точнее. а у первого мусор в начале.
Я когда парсил текста, делал регулярку такого плана:
Первая буква заглавная, слова где есть русские буквы, точка в конце
потом проверял длину предложения, короткие отбрасывал.
Я когда парсил текста, делал регулярку такого плана:
Первая буква заглавная, слова где есть русские буквы, точка в конце
потом проверял длину предложения, короткие отбрасывал.
друже, можешь выражение кидануть сразу а? ато я вот не силён в регвырах.. :(
Да мне не сложно, но они неправильно работают в программе
/[А-Я].+?(\.|\?|!)/s
А в том виде что у ТС в программе я не силен