Ink-developer

Ink-developer
Рейтинг
138
Регистрация
31.01.2009
Интересы
PHP, SEO

PHP + JavaScript + XHTML + CSS = Качественный сервис, хоть биржи, хоть сайты.

XHTML - разметка страниц.

CSS - цвета, размеры, рамочки и т.п.

JavaScript - динамика на странице. Библиотеки реккомендую: легкая JsHttpRequest, более тяжелая jQuery (в плане напичканности лишнего).

PHP - обработка всех данных на стороне сервера и передача обратно в браузер.

Использовать фреймворки считаю оправданно при массовой разработке, а не для себя, за частую получается больше лишнего чем нужного.

Не вариант, у меня хостинг проверенный годами. Вообще там ВДС, так что по идее самому можно нормальную версию iconv установить, но опять надо разбираться что да как. Как ее вообще найти где она на серваке эта dll лежит, я вчера не смог ее найти.

Как оказалось, при массовом парсинге разнообразных сайтов, тоже не стабильная функция, пропадают участки символов, даже в нужной кодировке, правда редкое явление но все равно не приятно.

Сейчас обдумываю вариант использовать обе функции, и после обработки текста выбирать спарсенную страницу на которой осталось больше текста. Т.к. функции косячат в разных местах, то риск потери информации уменьшается до минимума.

Что то вроде этого:

<?php header("Content-Type: text/html; charset=windows-1251");

function charset_convert($text,$charset){
$text1=mb_convert_encoding($text,"windows-1251",$charset);
$text2=iconv($charset,"windows-1251//IGNORE",$text);
if(strlen($text1)>strlen($text2)){ return $text1; }else{ return $text2; }
}
$text=charset_convert("текст в utf-8","utf-8");
?>
Tarry:
А что, сам Гогет косячит? Не замечал как-то особо, хотя и не проверял тщательно.

Я только что первый раз проверил, есть снятые ссылки, 10 дней до окончания 3 мес. система молчит, типа все нормально. Отписался администрации.

Alkoshenko:
проффесионализма

вообще хз что за слово :)

HozysoN:
скачать пару псд исходников сайтов и сверстать, учитывая полученные после просмотра уроков знания.

Тогда все точно будут просто в шоке от качества и профессионализма

Какие тут могут быть советы, информации куча, используйте только кроссбраузерные решения и развивайтесь. Рекомендую изучать сразу блочную (дивную) верстку, код гораздо компактней и аккуратней.

Так и не смог решит проблему с iconv, как альтернативу решил использовать mb_convert_encoding, вроде справляется хорошо:

$cont=mb_convert_encoding($cont,"windows-1251",$charset);

Отписываюсь на случай если кто поиском будет искать решение данной проблемы.

Очень хорошо, это уже программа минимум по модернизации, спасибо за ссылку, но я не смог импортировать туда ссылки, загружаю файл, а ни чего не происходит. Да и при вводе в окно, половина ссылок определилось как отсутствует на странице.

Вообще в ближайших планах сделать Экспорт/Импорт в Excel всех данных получаемых сервисом.

Кто подскажет, как победить следующую проблему:

Наткнулся на такую ситуацию, когда вебмастера умудряются внести в контент сайта одновременно символы из кодировки UTF-8 и WINDOWS-1251, страница выдает что она в UTF-8. Так оно и есть, но встречаются фрагменты левой кодировки, при просмотре исходного кода браузером, видно черные ромбики с вопросами.

Парсим такую страницу, определяем ее кодировку и при перекодировании:

$cont=iconv($charset,"windows-1251",$cont);

Соответственно обрезается на первом символе, который не совпадает с исходной кодировкой, лечим пропусканием левых символов:

$cont=iconv($charset,"windows-1251//IGNORE",$cont);

Все бы хорошо, но в более новой версии iconv, которая стоит на хостинге, даже //IGNORE не помогает и все равно половина страницы теряется. Как вылечить? Кикие есть альтернативы? Версия iconv на хостинге 2.6.1

Переписал скрипт заново, но оставив только необходимое, в итоге о чудо работает тот же самый код.

Начал искать "найди отличие в двух практически одинаковых функциях" почему одна работает другая нет.

Косяк оказался до безобразия простой, но коварно спрятался в коде :)

Затесалась после парсинга функция перевода в нижний регистр (strtolower) до конвертации кодировки, в итоге она и портила UTF-8 превращая его в крокозябры.

Банальная невнимательность убила кучу времени.

mixan:
Яндекс дурнуватая машина однозначно ;-) . с нормальных сайтов поснимал тиц , а на дорах которые под гугл делались добавил тиц :-)

Я предлагаю второй вариант ответа:

Быть может у кого-то не хватает мозгов, что бы понять, что ТИЦ это сумма веса всех ссылок ведущих на сайт, а не показатель его качества

если этот вариант верный, то:

mixan:
с нормальных сайтов поснимал тиц , а на дорах которые под гугл делались добавил тиц :-)

Вполне естественный результат, в зависимости от ссылок на пациентов.

А утверждение:

mixan:
Яндекс дурнуватая машина однозначно ;-)

Очередная глупость.

Всего: 834