DenisVS

Рейтинг
644
Регистрация
01.05.2010

Недвигу не надо сливать, её приобретать надо.

Сайты, проекты — всё это хорошо, но делать ставки на них, сравнимые со своим состоянием, нельзя. Это инвестиции с высоким риском.

Вот если бы у вас было 10 квартир, можно было бы пустить одну на эксперименты.

Пару дней тоже волнует вопрос накладных расходов при разных обращениях к базе. Где можно почитать?

У многих из нас скопилось множество текстовых файлов и листингов программ в разных кодировках.

Под Windows проблем почти не возникает, умные редакторы сами открывают, как надо. Не везде так радужно. Народный редактор mcedit переключает кодировки вручную. Великолепный инструмент кодера Geany часто определяет кодировку неверно. Ну и вообще, бардак надо устранять.

Существуют скрипты, перекодирующие поток. У них есть недостаток — для каждого файла надо указывать кодировку персонально. В общем, мне это надоело, и я написал автомат определитель-перекодировщик. Скрипт обрабатывает файлы в текущей и низлежащих директориях. Четыре кодировки на выбор. По аналогии, можете прикрутить любую другую.

#!/bin/sh

#For content
#permission must be 755!
#/path/to/script/transcoder.sh
#sh transcoder.sh KOI8-R
#Можно положить в Path /usr/local/bin/transcoder и вызывать transcoder KOI8-R
#Эта версия удаляет переносы DOS, не останавливается при невозможности перекодировать символ


#Получаем параметр из строки
TARGET_ENCODING=$*
#Скидываем в дефолт
IS_CP1251=0
IS_UTF_8=0
IS_UTF_8=0
IS_KOI8_R=0
IS_CP866=0
DO_IT=0
SAVEIFS=$IFS
#Устанавливаем разделитель строк
IFS='
'
if [ "${TARGET_ENCODING}" = "CP1251" ]; then
IS_CP1251=1
echo CP1251 $IS_CP1251
DO_IT=1
fi
if [ "${TARGET_ENCODING}" = "UTF-8" ]; then
IS_UTF_8=1
echo UTF_8 $IS_UTF_8
DO_IT=1
fi
if [ "${TARGET_ENCODING}" = "KOI8-R" ]; then
IS_KOI8_R=1
echo IS_KOI8_R $IS_KOI8_R
DO_IT=1
fi
if [ "${TARGET_ENCODING}" = "CP866" ]; then
IS_CP866=1
echo IS_CP866 $IS_CP866
DO_IT=1
fi
if [ "${DO_IT}" = 0 ]; then
echo "Please specify the target encoding."
echo "List of available encodings:UTF-8, CP1251, KOI8-R, CP866"
echo "Usage: transcoder <target encoding>"
echo "e.g.: transcoder UTF-8"
fi

#Если "добро" (кодировка указана явно)
if [ "${DO_IT}" = 1 ]; then
#Заносим список низлежащих файлов в массив
FILES_LIST=`find . -type f -name '*.ht*' -o -name '*.txt' -o -name '*.php' -o -name '*.sh' -o -name '*.dat'`
for FILE in ${FILES_LIST}; do
echo $FILE
#echo `enca $FILE`
#echo `enca $FILE | grep "line terminators"`
#echo `enca $FILE | grep "MS-Windows code page 1251"`
if [ "${IS_CP1251}" = 0 ]; then
CODEPAGE=`enca $FILE | grep "MS-Windows code page 1251"`
echo $CODEPAGE
if [ "${CODEPAGE}" = "MS-Windows code page 1251" ]; then
iconv -c -f CP1251 -t ${TARGET_ENCODING} "$FILE" | sed -e 's/'"`printf '\015'`"'$//' > tmp
mv -f tmp "$FILE"
fi
fi
if [ "${IS_UTF_8}" = 0 ]; then
CODEPAGE=`enca $FILE | grep "Universal transformation format 8 bits"`
echo $CODEPAGE
if [ "${CODEPAGE}" = "Universal transformation format 8 bits; UTF-8" ]; then
iconv -c -f UTF-8 -t ${TARGET_ENCODING} "$FILE" | sed -e 's/'"`printf '\015'`"'$//' > tmp
mv -f tmp "$FILE"
fi
fi
if [ "${IS_KOI8_R}" = 0 ]; then
CODEPAGE=`enca $FILE | grep "KOI8-R Cyrillic"`
echo $CODEPAGE
if [ "${CODEPAGE}" = "KOI8-R Cyrillic" ]; then
iconv -c -f KOI8-R -t ${TARGET_ENCODING} "$FILE" | sed -e 's/'"`printf '\015'`"'$//' > tmp
mv -f tmp "$FILE"
fi
fi
if [ "${IS_CP866}" = 0 ]; then
CODEPAGE=`enca $FILE | grep "IBM/MS code page 866"`
echo $CODEPAGE
if [ "${CODEPAGE}" = "IBM/MS code page 866" ]; then
iconv -c -f CP866 -t ${TARGET_ENCODING} "$FILE" | sed -e 's/'"`printf '\015'`"'$//' > tmp
mv -f tmp "$FILE"
fi
fi


#echo `enca $FILE | grep "Universal transformation format 8 bits`
#echo `enca $FILE | grep "7bit ASCII characters"`
#echo `enca $FILE | grep "KOI8-R Cyrillic"`
#echo `enca $FILE | grep "IBM/MS code page 866"`
#LF line terminators

done
fi
IFS=$SAVEIFS
Внимание! При перекодировке возможна потеря некоторых символов! Делать бэкап!

Великолепная enca работает лучше встроенных распознавателей многих редакторов!

Ещё бы альтернативу Адсенсу запилили…

rizenmusic, я обычно сграбливаю в csv, в одном из полей которого сохраняю пути, а потом вливаю с помощью feeds. Единственное, что не получается пока, сохранить метатеги, т.к. metatag/metatags до последнего раза не создаёт своё поле в feeds. Ну и с юзерами вопрос мутный (пока), при данном подходе.

Pavel_, то!

Сам прошёл через это. Изображения в разных форматах создаёт php, поэтому никаких файлов изначально нету. Вот nginx и думает, что несуществующий документ.

marc,

Alangasar:
а не nginx ли у вас?
Вон оно что!

И впрямь, посмотрите лог на счёт 404.

А вообще, настройте nginx при каждой 404 обращаться к бакэнду. Т.е. заведите для 404 отдельный lcation.

http://stackoverflow.com/questions/4812691/preserve-line-breaks-simple-html-dom-parser

В коде строка 1143

        //before we save the string as the doc...  strip out the \r \n's if we are told to.
Есть и ещё вхождения, надо экспериментировать.

Про Боржоми знаю, но всё же.

1. mail.ru ненадёжная контора, в плане организационном, политическом и техническом, много раз обсуждали.

2. Антивирус не даёт защиты вообще! Его задача отлавливать общеизвестную заразу, которая обрушила не один десяток машин. Я не Бог весть какой программист, однако из спортивного интереса писал на AutoIT червя, которым мог делать всё, что угодно, безнаказанно. Проверено со всеми ведущими антивирусами.

обязательно ли заключать трудовой договор с самим с собой и платить з/п, взносы в ПФР?

Без вариантов. Хотя бы по-минимуму, на пол ставки или ещё как.

Не голословие, у самого ЗАО.

Всего: 14528