Чем перелопатить текст? Или как лучше собрать ID вконтакте?

B
На сайте с 17.04.2010
Offline
97
1454

Здравствуйте!

Не уверен что иду верным путем, но для сбора нужных ID вконтакте не придумал ничего лучше, чем вытащить исходный код страницы и выбрать оттуда адреса страниц пользователей.

Теперь у меня есть куча текста такого плана:

<div class="people_row three_col_row clear_fix">

<div class="img search_bigph_wrap fl_l" onmouseover="Searcher.bigphOver(this, 31178798)">
<a href="http://vk.com/soeugenia" onclick="return nav.go(this, event);"><img class="search_item_img" src="%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%20%D0%BB%D1%8E%D0%B4%D0%B5%D0%B9%20%D0%92%D0%9A%20%2818-25%29_files/TmUcs0LmzCE.jpg"></a>
</div>
<div class="info fl_l">
<div class="labeled name"><a href="http://vk.com/soeugenia" onclick="return nav.go(this, event);">Евгения Соколова</a></div><div class="labeled ">19 лет</div><div class="online">Online<b class="mob_onl search_mob_onl" onmouseover="mobileOnlineTip(this, {mid: 31178798})" onclick="mobilePromo(); "></b></div>
</div>
</div>

Вопрос, как отсеять все лишнее, оставив только адреса вида

http://vk.com/soeugenia

Спасибо за советы и подскажите кто знает, чем разослать приглашения в друзья всем этим пользователям? С контактом и прочими соц. сетями раньше не работал.

Делаю лендинги и не только. Маркетолог. Обучаю. Ответы на вопросы по Elementor (/ru/forum/1015634). Можно стучаться мне прямо в ВК (https://vk.com/valeost). Ничего не продаю, не навязываю
L0
На сайте с 22.07.2006
Offline
85
#1

написать простенькое регулярное выражение, а разослать хз(

B
На сайте с 17.04.2010
Offline
97
#2

Насколько простенькое? :) Мучаюсь сделать рабочий для этого дела скрипт в программах типа MouseRobot и Perfect Automation, но пока рабочим прототипом похвастаться не могу (

AK
На сайте с 23.02.2009
Offline
117
#3

Даже в блокноте без регулярок можно сделать:

1. <div class="labeled name"><a href=" заменить на пусто

2. " onclick="return за менить на \r\n

3. удалить строки содержащие this, event

Профит

B
На сайте с 17.04.2010
Offline
97
#4
ant_key:
Даже в блокноте без регулярок можно сделать:
1. <div class="labeled name"><a href=" заменить на пусто
2. " onclick="return за менить на \r\n
3. удалить строки содержащие this, event
Профит

Спасибо что навел на мысль! После этих шагов прошелся макросом и получил профит )

Как бы ты удалил строки содержащие this, event?

DV
На сайте с 01.05.2010
Offline
644
#5

В shell одной строкой делается

cat file.txt | grep "http://vk.com/" | awk -Fhref=\" '{print $2}' | awk -F \" '{print $1}'
Это прямо из исходного html
VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
AK
На сайте с 23.02.2009
Offline
117
#6
benmer:
Как бы ты удалил строки содержащие this, event?

В notepad++: ctrl-F - вкладка пометки, там галочку "помечать закладкой", жмем поиск

затем

правка - закладки - удалить все строки с закладками.

B
На сайте с 17.04.2010
Offline
97
#7
DenisVS:
В shell одной строкой делается
cat file.txt | grep "http://vk.com/" | awk -Fhref=\" '{print $2}' | awk -F \" '{print $1}'

Это прямо из исходного html
ant_key:
В notepad++: ctrl-F - вкладка пометки, там галочку "помечать закладкой", жмем поиск
затем
правка - закладки - удалить все строки с закладками.

Большое спасибо за советы!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий