simple_html_dom работает некорректно

LovelAss
На сайте с 05.06.2009
Offline
96
1056

Всем привет!

Столкнулся сегодня с непонятной мне ситуацией - функция file_get_html(), которую включает в себя библиотека simple_html_dom.php, возвращает код только до первого закрывающего тега, к примеру для сайта ya.ru это:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head><title>Яндекс

и для другого сайта:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en"> <head> <meta name="keywords" content="">

причём в исходном коде этого сайта строка <meta name="keywords" content="" /> имеют закрывающий слэш.

На локальном сервере работает всё как надо, а вот на сервере клиента почему-то такая беда. Грешу на настройки сервера, но вот какие настройки тут виноваты ума не приложу. Никто не сталкивался с подобной ситуацией?

LEOnidUKG
На сайте с 25.11.2006
Offline
1726
#1

Чем эта функция отличается от стандартной file_get_contents?

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/
IL
На сайте с 20.04.2007
Offline
435
#2
LEOnidUKG:
Чем эта функция отличается от стандартной file_get_contents?

одна - обёртка над другой.

---------- Post added 27-06-2013 at 17:45 ----------

LovelAss, если содержимое получить через file_get_contents или через CURL, а потом его в str_get_html - что будет?

... :) Облачные серверы от RegRu - промокод 3F85-3D10-806D-7224 ( http://levik.info/regru )
LovelAss
На сайте с 05.06.2009
Offline
96
#3
ivan-lev:
LovelAss, если содержимое получить через file_get_contents или через CURL, а потом его в str_get_html - что будет?

Тоже самое.

file_get_contents на хостинге работает корректно и возвращает весь код, проблема таится где-то в процессе разбора этого кода.

IL
На сайте с 20.04.2007
Offline
435
#4
LovelAss:
проблема таится где-то в процессе разбора этого кода.

Не сталкивался с таким.. Если б не "Яндекс" - на кодировку бы подумал... А так - вряд ли, хотя...

Версия, надеюсь, последняя?

Можно с параметрами/настройками поиграться.. - там $forceTagsClosed есть...

Да и код открытый - можно подебажить..

p.s. Как-то больше phpquery по душе пришёлся. :) Ну и XPath ещё имеется.

p.p.s. Если удастся выявить и воспроизвести - возможно, имеет смысл разработчикам багрепорт отправить.

siv1987
На сайте с 02.04.2009
Offline
427
#5

А как вы собственно определяете какой код возвращается, если функция возвращает объект?

---------- Добавлено 27.06.2013 в 19:29 ----------

LovelAss:
file_get_contents на хостинге работает корректно и возвращает весь код, проблема таится где-то в процессе разбора этого кода.

http://stackoverflow.com/questions/14962359/how-to-use-file-get-contents-or-file-get-html

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий