Скрипт парсер title

BlackvsEvgen
На сайте с 21.08.2009
Offline
74
1639

Добрый день, не получаеться сохранить данные спарсенные скриптом в нормальной кодировке, одни крякозяблы сохраняет.

Сам скрипт вот:

<?php

$urls = fopen("urls.txt", "r");
while (!feof($urls))
{
$url = trim (fgets ($urls));
$content=file_get_contents($url);
if (preg_match("!<title>(.*?)</title>!si", $content, $title))
{
file_put_contents ("titles.txt", $url." ".$title [1]."
", FILE_APPEND);
}
}
fclose ($urls);
?>

Помогите разобраться пожалуйста.

Любимый хостинг (http://bit.ly/VW9SbN) | Постовые для вашего сайта (http://bit.ly/WPm6Et)
siv1987
На сайте с 02.04.2009
Offline
427
#1

icnov, mb_convert_encoding в помощь

BlackvsEvgen
На сайте с 21.08.2009
Offline
74
#2

siv1987 я понимаю, но пытаюсь реализовать и не получаеться. Пробовал вот в таком виде:

file_put_contents ("titles.txt",iconv("windows-1251", "UTF-8", $url." - ".$title [1]."

"), FILE_APPEND);

BlackvsEvgen добавил 29.07.2011 в 15:59

Вместо ***91 квадратные скобочки... почему-то форум режит их.

zhyk
На сайте с 13.07.2005
Offline
103
#3

$content=file_get_contents($url);

$content = iconv("UTF-8","windows-1251//IGNORE", $content);

siv1987
На сайте с 02.04.2009
Offline
427
#4

Html откуда парсится title в какой кодировке? Зачем нужно сохранять в utf-8?

Данные на выходе из preg_match нормально отображаются?

BlackvsEvgen
На сайте с 21.08.2009
Offline
74
#5

siv1987 Проблема в том, что чать title в UTF-8, а другая часть в windows-1251. Получаеться что половина нормально, а другая нет.

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#6
✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
BlackvsEvgen
На сайте с 21.08.2009
Offline
74
#7

LEOnidUKG всё это читал, но ответа нормального нигде нету, как проверять кодировку.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий