- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Делаю парсинг рассказов.
Сначала беру с главной страницы первую ссылку на последний добавленный рассказ.
Скачиваю рассказ.
Пытаюсь выдернуть название рассказа,
но ничего не получается.
ужас. вас бы послать поучить регулярные выражения.
php.net/preg_match
А в регулярных выражениях будет работать поиск по русским буквам?
У вас там видимо utf-8, а с ним стандартные строковые функции php работают нехорошо. Используйте функции с приставкой mb_
Хотя лучше всё-таки переписать на регулярки. Да, они нормально работают с utf-8.
Кстати, тут как минимум одна ошибка: название статьи не будет находиться, т.к. $begin=strpos(strtolower($f), 'Название:', 0); Первый аргумент функции не содержит знаков в верхнем регистре, а во втором аргументе они есть. Тут либо использовать функцию stripos, либо strtolower делать на оба аргумента.
посмотрел, оказывается вас эта ошибка и интересует :) Ну и вместо join('',file()) используйте file_get_contents() раз уж curl использовать вероисповедание не позволяет.
У вас там видимо utf-8, а с ним стандартные строковые функции php работают нехорошо. Используйте функции с приставкой mb_
Хотя лучше всё-таки переписать на регулярки. Да, они нормально работают с utf-8.
Сайт sexytales.ru в кодировке windows-1251,
скрипт в кодировке ANSI.
Может использовать convert_cyr_string() ?
В ней можно указать w - windows-1251;
но какую букву указать для ANSI ?
srarwars добавил 06.05.2009 в 14:16
Ну и вместо join('',file()) используйте file_get_contents() раз уж curl использовать вероисповедание не позволяет.
Да мне как то больше нравятся сокеты.
Так сказать - ближе к глубинам протоколов Сети.
А этот случай просто исключение