Проблема с кодировкой, инфа тянется с другого сайта

12
Redbaron _chaos
На сайте с 12.08.2009
Offline
673
1352

Всем здравствуйте.

Проблема заключается в следующем:

Есть сайт и скрипт (зашифрованный)), он тянет новости с другого сайта (все легально). На выходе получаются превьюшки, ну новость с коротким описанием, нажимаешь и уже новая страница с более детальным. В общем как и на всех новостниках.

Так вот, дня как три-четыре, все эти коротки новости, превратились в кракозябры. При этом полная новость открывается на русском. Посмотрев парочку конкурентов (у которых этот же скрипт, знал их давно) и увидел что у них, то же самое, значит проблема в источнике, что то он там поменял у себя). Остальной текст на сайте, который не тянется, с ним все нормально.

Проблема в том:

1) Скрипт написан каким то индусом (естественно на английском все нормально тянется, проблема только с русским), автор года три его не поддерживает и вообще пропал (там где он продавался, буржуйские покупатели давно пытаются до него достучаться и бесполезно).

2) Все зашифровано и как понял раз стопицот). Ни один декодер не помог. Хотя я в этом совсем не силен и могу ошибаться.

Естественно пробовал в Хтачесе указать UTF-8 и т.д., бесполезно.

Погуглил и попробовал вот такие способы, ну как смог, не помогло: https://school-php.com/tricks/18/vyistavlyaem-kodirovku-utf-8

Что можете еще посоветовать, есть способ убрать эти кракозябры, не расшифровывая скрипт? Или не возможно?

Гемблинг, беттинг, крипта на весь мир в 3snet, 1500+ офферов. ( https://clck.ru/TdZLM ) = = CPA.HOUSE - Топовая CPA сеть ( https://clck.ru/34Swci )
[umka]
На сайте с 25.05.2008
Offline
456
#1

Воздействием извне вы вряд ли поможете зашифрованному скрипту, если у него проблема с кодировками.

Можно попробовать перекодировать уже скачанные данные, если в них не было потери информации.

Лог в помощь!
Redbaron _chaos
На сайте с 12.08.2009
Offline
673
#2

[umka], проблема еще в том, что контент динамический, если можно так выразится. То есть не сохраняется в БД или где либо на хостинге в папочке (хотя возможно кэшируется, сейчас просматриваю).

И есть еще один сайт, где совсем другой скрипт, но тянет новости оттуда же. И такой же древний (то есть года два-три ни чего не обновлялось), НО вот на нем все нормально! И почему разом сломался этот и не только у меня, фиг поймешь.

Видимо придется искать, кто расшифрует)

SeVlad
На сайте с 03.11.2008
Offline
1609
#3
Redbaron_chaos:
все эти коротки новости, превратились в кракозябры. При этом полная новость открывается на русском.

Вот это интересно. А они что, по разному тянуться? С разных страниц?

Проверь источники, поменяй их если возможно.

Redbaron_chaos:
То есть не сохраняется в БД или где либо на хостинге в папочке

Вряд ли совсем не сохраняется. Но очень может быть, что создаёт временны файлы. Тогда фигово.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
Redbaron _chaos
На сайте с 12.08.2009
Offline
673
#4
SeVlad:
Вот это интересно. А они что, по разному тянуться? С разных страниц?
Проверь источники, поменяй их если возможно.

В том и проблема, что я мало что могу сделать:

1) Сайт+скрипт были изначальны заточены для новостей с одного сайта, ну он как бы для этого и делался. Так что источник там один и поменять его, ни как нельзя). Даже в конфиг файле нет возможности.

Этот источник дает возможность через XML тянуть, есть файлик который так примерно и называется ParserXML.php

В нем немного обычного кода, который не влияет особо на работу и вконце уже зашифрованный c словом base64_decode. Вот если этот зашифрованный удаляешь, новости пропадают.

Я конечно пытался через онлайн декодеры его расшифровать, безуспешно. Как только не извращался и перепробовал десятки онлайн сервисов.

Вот поэтому меня и интересует, есть ли варианты какие нибудь еще. На подобие как в Хтачес прописал и кодировка меняется.

Я понимаю что контент с другого сайта, не сохраняется или временно, но все же...

SeVlad
На сайте с 03.11.2008
Offline
1609
#5
Redbaron_chaos:
Вот поэтому меня и интересует, есть ли варианты какие нибудь еще. На подобие как в Хтачес прописал и кодировка меняется.
Я понимаю что контент с другого сайта, не сохраняется или временно, но все же...

Ну смотри - непонятка почему с анонсами проблема, а с полными нет. Если анонсы формируются из полной, то выходит что проблема именно на странице с анонсами. Может с самой страницей, а может и в момент импорта в неё.

Кста - проверь кодировку и страниц в браузере и файлов, за это отвечающих.

Мож на сервере кодировка сбилась, а в файлах где-то принудительно прописано, а где-то нет. Ну или сами файлы в разной кодировке.

L
На сайте с 07.12.2007
Offline
351
#6
Redbaron_chaos:
Этот источник дает возможность через XML тянуть, есть файлик который так примерно и называется ParserXML.php
В нем немного обычного кода, который не влияет особо на работу и вконце уже зашифрованный c словом base64_decode.

На PHP невозможно ничего зашифровать без ionCube или Zend. Просто расшифруйте:

echo base64_decode(ваш_зашифрованный_код);

и вставьте уже расшифрованный код на место зашифрованного.

Почему могла сбиться кодировка:

- сайт-донор перешёл с cp1251 на UTF-8, а в зашифрованном скрипте не делается iconv()

- сайт-донор стал отдавать некорректный <meta charset но посылает корректную кодировку через headers. А зашифрованный скрипт опирается на <meta charset. (или наоборот)

Redbaron _chaos
На сайте с 12.08.2009
Offline
673
#7

SeVlad, Ladycharm, понял, спасибо. Буду сейчас пробовать и смотреть.

Redbaron _chaos
На сайте с 12.08.2009
Offline
673
#8

Расшифровать удалось, в два этапа при чем пришлось (при расшифровки еще какой то "код непонятный получился"), как и сам не понял, таких танцев с бубнами я наверно лет 10 не делал, перед компом.

В коде все понятно практически, но кодировка ни где не упоминается.

Но уже хоть что то, с этим уже легче методом тыка действовать).

Есть идеи, буду пробовать. Тем более расшифрованный код, прекрасно работает, если его вместо зашифрованного поставить.

Redbaron _chaos
На сайте с 12.08.2009
Offline
673
#9

Только сегодня получилось добраться до сайта.

В общем я запутался:

Если коротко, выставляешь любую кодировку, хоть Windows-1251, хоть еще какую (к примеру КОИ) и т.д., короткие новости реагируют и кракозябры меняются). То есть видно, что можно у себя на сайте менять.

UTF-8 ставишь, опять же кракозябры. Русский ни как не хочет отображать.

И основная проблема, которая мне видится в том, что как оказалось (хз как прощелкал этот момент): на сайте доноре, то же самое! То есть он тянет как есть. Там кракозябры и у меня они выходятся. То есть по сути, проблема у них и скрипт тянет все правильно.

Посмотрел в какой кодировке текст, декодер при расшифровке показал: ISO-8859-1 → UTF-8 (то есть у них ISO-8859-1).

Что можно еще сделать?

SeVlad
На сайте с 03.11.2008
Offline
1609
#10
Redbaron_chaos:
То есть он тянет как есть.

Т.е. проблема не в скрипте. :)

Redbaron_chaos:
Что можно еще сделать?

Вероятно остаётся вскрывать и править скрипт, что бы он перекодировал.

http://php.net/manual/ru/function.iconv.php

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий