LEOnidUKG

LEOnidUKG
Рейтинг
1778
Регистрация
25.11.2006
Должность
PHP
Интересы
Программирование
Sitealert:
Поразительное упорство - зная, что там не cp1251, пытаться конвертировать из cp1251 🤪

Нет тут проблема, что всё доверилось стандартным функциям, а они в этом деле "неалло".

ок
делаю
$a->plaintext = iconv("windows-1251","UTF-8//TRANSLIT//IGNORE",$a->plaintext);
в БД русские буквы Продажа

Конкретно этого сайта?

парсинг разных сайтов идет

Так проверяйте по этой строчке на странице:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

если нет этой строчки, то проверяйте по хедеру ответа в какой кодировке предоставляются данные.

Но никак не функциями PHP

---------- Добавлено 17.11.2017 в 14:02 ----------

в БД русские буквы Продажа

как вы это смотрите? phpmyadmin последней версии? БД и таблицы точно в utf-8? При подключении к БД случаем кодировка cp1251 не выставлена?

Это распил бабла для "поддержки" малого предприятия.

joost:
там указано windows-1251
а определяется как ASCII
может в этом проблема?

Ничего не надо определять или смотреть. Берёте просто мой кусок кода и с ним работаете. Не надо функцию по определению кодировки вставлять вообще.

Ну весь сайт в win1251 в чём проблема то?! Какие там куски не в этой кодировке?

Я же дал вам код, вы сказали с ним всё ок. Тогда в чём проблема то?!

По-моему что-то там не ладное или проблема решается не с того бока.

Определение кодировки в PHP и так кривое, а уж разные куски и такие выкрутасы она будет показывать бред.

Определять кодировку по кусочку текста это неблагодарное дело. Лучше узнавать кодировку по всему тексту изначальному и смотреть, что там за кодировка.

а robots.txt бот пс может иногда и подзабить.

Он может подзабить на всё.

W3C
Это влияет на продвижение сайта каким либо образом?

Нет, не влияет. Просто смотрите, чтобы не было фатальных ошибок в виде незакрытых тэгов. Также возможно ошибки просто из-за не правильного выбранного доктайпа.

<meta name="robots" content="noindex,nofollow"> - ставиться точечно или когда нужно убрать страницу из индекса ПС.

robots.txt это говорит сразу же вообще туда не заходить и не смотреть, что за страница. Даже если она уже в индексе, она будет висеть после запрета.

Всего: 31535