- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Добрый день.
Прошу помочь решить проблему.. желательно программами, которые можно найти в открытом доступе.
Задача: Есть сайт, который построен на одном шаблоне. В html коде каждой страницы есть уникальные строчки, которые более на странице не повторяются: <h1> бла..бла..бла.. <eho>. Необходимо вытащить html код, который находится внутри этого диапазона, со всех страниц сайта.
Весь html код сайта есть локально на компьютере, но чтобы ручками каждую страницу не открывать и не копировать, нужно автоматом от и до заданного места вытащить все что внутри находиться :)
python + pyquery
Notepad - открыть все файлы и автозаменой шлепнуть)
текст что нужно убрать - на пустое поле
Notepad - открыть все файлы и автозаменой шлепнуть)
текст что нужно убрать - на пустое поле
Если файлов пару сотен, то да, если значительно больше или сменить надо строк 20, то Notepad бессилен.
Вот этой штукой Search And Replace менял недавно на 20+тыс страницах счётчик Li на Метрику.
Вот этим Search And Replace менял недавно на 20+тыс страницах счётчик Li на Метрику.
Счетчик изначально в футере разместить не вариант?
serjoo, старый, самый первый дор, без инклюдов сделал. Теперь то да, конечно всё разбиваю на инклюды. Но тема вроде как не об этом. 🍿
Если файлов пару сотен, то да, если значительно больше или сменить надо строк 20, то Notepad бессилен.
Вот этой штукой Search And Replace менял недавно на 20+тыс страницах счётчик Li на Метрику.
Файлов чуть более 3к
И надо не сменить что-то на что-то, а вытащить и поместить в отдельный файл/файлы (текстовые документы) то что вытащили.
Как писал выше, я могу задать только строчку/слово откуда надо начинать вытаскивать и то, где надо закончить.. Внутри разное кол-во текста в html коде.
Content Downloader, но только он платный, можете попросить кого нибудь спарсить.
И надо не сменить что-то на что-то, а вытащить и поместить в отдельный файл/файлы (текстовые документы) то что вытащили.
В первом посте вроде этого нет.
А всё остальное без проблем:
Фома, то что надо вытащить писал ранее.. а то что поместить в "левый" файл не писал, да :)
Так что интересует не замена, а именно парсинг определенного заданного участка внутри html кода страницы.
PS спасибо всем кто обратил внимание на мою проблему.. надеюсь что получиться ее решить)
Brucekiev, можете посмотреть в сторону grep, если в файле искомая строка четко задается регуляркой, то можете поюзать grep -P