Настройка WPGrabber

12
M
На сайте с 20.03.2012
Offline
57
2756

Добрый день!

Подскажите, что нужно указывать в "Шаблон ссылок" для сайтов, у которых в адресе русские символы

домен.рф/русские-символы/

[\w\d-_]{1,} - не помогает (

Николай Серваков
На сайте с 12.11.2017
Offline
16
#1

/[[:alpha:]-_]{1,}

Настройка лент WPGrabber (http://wpgrabber-tune.blogspot.com) Настрою парсер контента shs.parser (https://sites.google.com/view/shs-parser-sotbit) Сотбит
M
На сайте с 20.03.2012
Offline
57
#2

что-то не помогает (

В адресе используется кириллица

https://ru.investing.com/news/%D0%9D%D0%BE%D0%B2%D0%BE%D1%81%D1%82%D0%B8-%D0%A4%D0%BE%D1%80%D0%B5%D0%BA%D1%81

Стоит: WPGrabber 3.0

Николай Серваков
На сайте с 12.11.2017
Offline
16
#3


/news/[\S-_\/]{6,}/article-[\d]{6}

M
На сайте с 20.03.2012
Offline
57
#4

Пробовал для другого сайта.

Пишет: Найдено ссылок: 0

URL индексной страницы

https://xn--e1aktc.xn--p1ai/%D1%82%D0%B2-%D0%BA%D0%B0%D0%BD%D0%B0%D0%BB%D1%8B/%D1%81%D0%B5%D0%BA%D1%81_%D0%B8_%D0%B7%D0%B4%D0%BE%D1%80%D0%BE%D0%B2%D1%8C%D0%B5/%D1%82%D0%B5%D1%85%D0%BD%D0%B8%D0%BA%D0%B8_%D1%81%D0%B5%D0%BA%D1%81%D0%B0/

Шаблон ссылок

https://xn--e1aktc.xn--p1ai/%D1%82%D0%B2-%D0%BA%D0%B0%D0%BD%D0%B0%D0%BB%D1%8B/%D1%81%D0%B5%D0%BA%D1%81_%D0%B8_%D0%B7%D0%B4%D0%BE%D1%80%D0%BE%D0%B2%D1%8C%D0%B5/%D1%82%D0%B5%D1%85%D0%BD%D0%B8%D0%BA%D0%B8_%D1%81%D0%B5%D0%BA%D1%81%D0%B0/[\S-_\/]{6,}/

Шаблон заголовка

<div class="player-wrap">

Конечная точка полного текста

<div class="related-videos videos">

страницы которые по идее должен парсить

view-source:https://xn--e1aktc.xn--p1ai/%D1%82%D0%B2-%D0%BA%D0%B0%D0%BD%D0%B0%D0%BB%D1%8B/%D1%81%D0%B5%D0%BA%D1%81_%D0%B8_%D0%B7%D0%B4%D0%BE%D1%80%D0%BE%D0%B2%D1%8C%D0%B5/%D1%82%D0%B5%D1%85%D0%BD%D0%B8%D0%BA%D0%B8_%D1%81%D0%B5%D0%BA%D1%81%D0%B0/%D1%81%D0%B5%D0%BA%D1%80%D0%B5%D1%82%D1%8B_%D0%BC%D1%83%D0%B6%D1%81%D0%BA%D0%B8%D1%85_%D0%BE%D1%80%D0%B3%D0%B0%D0%B7%D0%BC%D0%BE%D0%B2_%D0%BC%D1%8B%D1%88%D1%86%D1%8B_%D0%B2%D0%BB%D0%B0%D0%B3%D0%B0%D0%BB%D0%B8%D1%89%D0%B0/

https://секс.рф/%D1%82%D0%B2-%D0%BA%D0%B0%D0%BD%D0%B0%D0%BB%D1%8B/%D1%81%D0%B5%D0%BA%D1%81_%D0%B8_%D0%B7%D0%B4%D0%BE%D1%80%D0%BE%D0%B2%D1%8C%D0%B5/%D1%82%D0%B5%D1%85%D0%BD%D0%B8%D0%BA%D0%B8_%D1%81%D0%B5%D0%BA%D1%81%D0%B0/%D0%B0%D0%BD%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D0%B8%D0%BC%D1%83%D0%BB%D1%8F%D1%86%D0%B8%D1%8F_%D0%BC%D1%83%D0%B6%D1%87%D0%B8%D0%BD%D1%8B/

Также пробовал использовать разные значения "Для запросов использовать метод"

M
На сайте с 20.03.2012
Offline
57
#5

Так у меня и не получается((

Николай Серваков
На сайте с 12.11.2017
Offline
16
#6

см. вложение

zip xn--e1aktc.zip
M
На сайте с 20.03.2012
Offline
57
#7

Лента не работает (

Эта лента получается, что парсит сам блок, а не внутренние страницы блока?

На основании Ваших настроек, попробовал настроить, чтоб парсил внутренние страницы, но пишет то не найден текст, то пустая страница - изменял настройки "Для запросов использовать метод" .

Настройки прилагаю.

Еще такой вопрос:

возможно ли делать имена картинок в виде названий статьи, сейчас просто набор символов?

zip xn--e1aktc.xn--p1ai.zip
M
На сайте с 20.03.2012
Offline
57
#8
Николай Серваков
На сайте с 12.11.2017
Offline
16
#9
Michgan:

Еще такой вопрос:
возможно ли делать имена картинок в виде названий статьи, сейчас просто набор символов?

Нет, нельзя.

M
На сайте с 20.03.2012
Offline
57
#10

Так и не получается настроить ленту чтоб парсил внутренние старницы.

Выдает все время пустая страница

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий