- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
системная локаль ru_RU.KOI8-R, все html-файлы в CP1251, и такая штука в indexer.conf:
LocalCharset windows-1251
Mime application/pdf text/html "/usr/bin/pdftohtml -enc KOI8-R -stdout -opw PASSWORD $1 2>/dev/null"
тока одна проблема,- в результатах поиска заголовок PDF'а выводится криво, типа:
1. рХР. КХЯР Й яро 1.011 [5.387% Популярность: 0.00000]
... Правовой акт, издаваемый ... для внутренних документов (Приложение А, Б); 2)...
* http://site/11.pdf.. - 631899 bytes [application/pdf] - Tue, 04 Apr 2006, 09:47:27 SAMST [Копия из кэша]
mnogosearch-3.2.33-mysql
Mark Silinio, смотрите сайт из подписи если не поможет
не всё так просто,- для CP1251 нужен соответствующий файл CP1251.unicodeMap
KOI8-R.unicodeMap есть в поставке
Mark Silinio, что вам мешает его найти?
CP1251.unicodeMap днём с огнём не найти, ну да это и неважно,-
делаем в indexer.conf:
Mime application/pdf text/html "/usr/bin/pdftohtml -enc KOI8-R -stdout -opw EnCobuc8 $1 2>/dev/null | /usr/local/bin/titlefix.pl"
titlefix.pl:
#!/usr/bin/perl
use Text::Iconv;
$converter = Text::Iconv->new("cp1251","koi8-r");
while(<>){
$_ = $converter->convert($_) if $_ =~ /^\<TITLE\>/;
print;
}
всё работает!
Хм, а зачем так извращаться ? :)
Ставьте -enc UTF-8, mnogosearch его вполне понимает :)
Хм, а зачем так извращаться ? :)
Ставьте -enc UTF-8, mnogosearch его вполне понимает :)
понимает
но тогда(без titlefix.pl) в заголовке одни вопросительные знаки
тут проблема с самим pdftohtml