Как спарсить тайтлы страниц

12
successprofit
На сайте с 06.03.2013
Offline
123
2578

Помогите советом. Как спарсить тайтлы страниц? При том, что нужно спарсить тайтлы собственных сайтов.

◄ Самый надежный хостинг. ( https://tiny.one/mrye2frf ) - Пользуюсь 9 лет. ◄ | ► Лучшая партнерка. Много офферов. Стабильные выплаты: https://tinyurl.com/podpys ◄ | ► Лучшая ПП под юридический траф: https://tinyurl.com/leadpush
[Удален]
#1

Действуйте также, как и при парсинге чужих тайтлов ;)

makar3000
На сайте с 02.01.2012
Offline
17
#2

successprofit, Скажите пожалуйста, на каком языке программирования вам написать пример?

---------- Добавлено 28.05.2013 в 18:57 ----------

Если на php, вот написал на скорую руку:

<?php

ini_set('display_errors', 1);
error_reporting(E_ALL);
$___notjson = 1;

if(isset($_POST['text'])) {
$data = explode("\n", $_POST['text']);
for($i=0;$i<count($data);$i++)
if(preg_match('#<title>(.*?)</title>#si', file_get_contents(trim($data[$i])), $title))
echo 'Сайт: '.trim($data[$i]).' - ['.$title[1].']<br/>';
}
?>
<div align="center">
<h1>Введите адреса сайтов</h1>
<form action="" method="post">
<textarea name="text" style="width:200px; height:400px;"></textarea><br/>
<input type="submit" value="Парсить" />
</form>
</div>
Милованов Ю.С
На сайте с 24.01.2008
Offline
196
#3

Что значит "как"???

Язык программирования? Вариации парсинга? Надо ли по сайту бегать скриптом, или же урлы уже есть в тхт/эксель/ксв/БД/и.т.д? 100500 вопросов...

Подпись))
successprofit
На сайте с 06.03.2013
Offline
123
#4

Ребята, может есть уже готовые парсилки которые распознают и сохранят <title> и т.п. Не знаю как указать язык программирования, может кто парсил. А парсить нужно нужно действительно свои, так как данных не осталось. А очень нужны. Спс.

ishipilov
На сайте с 25.12.2011
Offline
101
#5

если с собственных сайтов, то проще парсить из базы данных.

successprofit
На сайте с 06.03.2013
Offline
123
#6
makar3000:
successprofit, Скажите пожалуйста, на каком языке программирования вам написать пример?

---------- Добавлено 28.05.2013 в 18:57 ----------

Если на php, вот написал на скорую руку:
<?php
ini_set('display_errors', 1);
error_reporting(E_ALL);
$___notjson = 1;

if(isset($_POST['text'])) {
$data = explode("\n", $_POST['text']);
for($i=0;$i<count($data);$i++)
if(preg_match('#<title>(.*?)</title>#si', file_get_contents(trim($data[$i])), $title))
echo 'Сайт: '.trim($data[$i]).' - ['.$title[1].']<br/>';
}
?>
<div align="center">
<h1>Введите адреса сайтов</h1>
<form action="" method="post">
<textarea name="text" style="width:200px; height:400px;"></textarea><br/>
<input type="submit" value="Парсить" />
</form>
</div>

..... А как сделать чтобы сохраняло куда-то результаты парсинга и парсило все странички?

---------- Добавлено 28.05.2013 в 21:20 ----------

ishipilov:
если с собственных сайтов, то проще парсить из базы данных.

Базы нет, все статика.

makar3000
На сайте с 02.01.2012
Offline
17
#7

successprofit, не умеете - не беритесь. Не думаю что вам нужна лишняя головная боль. Наймите фрилансера

satellitmaker
На сайте с 04.08.2011
Offline
90
#8

Есть программа ContentDownloader, правда платная, можете либо купить либо найти спеца с прогой либо написать мне :)

Попробую помочь.

successprofit
На сайте с 06.03.2013
Offline
123
#9
makar3000:
successprofit, не умеете - не беритесь. Не думаю что вам нужна лишняя головная боль. Наймите фрилансера

Спасибо большое Вам за программку, работает, может домучаю чтобы сохранялось. Но все кто начинал - поначалу не знал ничего, а терпение и труд все перетерли)) Еще раз спасибо. Парсит!

D8
На сайте с 16.06.2007
Offline
74
dm8
#10

простая проверка - в одну сторону - 3 замены ( /> )

обратно - 15, - еще смотреть?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий