- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
В общем проблема такая
при конвертации PDF в HTML
на выходе софт заменяет все русские буквы на их HTML-коды
т.е. получается вот так примерно ...
вот хочу узнать как воспримут поисковики странички в таком виде ....
отображается то оно нормально прям как надо ... а вот внутри ... сплошные коды ни единой русской буквы ...
или может кто посоветует софтинку которая может это конвертнуть в приличный вид ...
т.е. поменять HTML коды на сами буквы ...
???
В любом случае надо сконвертить, хотя бы для порядку.
А коды такие получаются, потому что софтина у вас выдаёт западноевропейскую кодировку. Настройте её на отдачу UTF-8 или WIN-1251, либо поищите замену, либо используйте промежуточные форматы, RTF, например.
софтину настроить не получится .....
через промежуточный формат - код в итоге полное гавно ....
аналогов софта не нашел ... точнее перепробывал кучу но опять же в итоге код - гавно ...
а конвертить надо массово ... и доводить до чистоты каждый документ это у меня пару лет уйдет ...
так что нужен отдельный софт который бы конвертил все в нормальные буквы .... есть предложения ? а то я что-то ничего не нагуглил ...
софтину настроить не получится .....
через промежуточный формат - код в итоге полное гавно ....
аналогов софта не нашел ... точнее перепробывал кучу но опять же в итоге код - гавно ...
а конвертить надо массово ... и доводить до чистоты каждый документ это у меня пару лет уйдет ...
так что нужен отдельный софт который бы конвертил все в нормальные буквы .... есть предложения ? а то я что-то ничего не нагуглил ...
Както же китайскую грамоту поисковики воспринимают... Воспримят и твой... собственно изобретенный язык...
флудить просто ни о чем идите плиз в другое место .....
если есть что сказать по теме - говорите
DOKTOR_666, сохраняйте текст из pdf в текстовый файл, в текущем виде, затем с помощью какой-либо утилиты делайте замену значений символов (которые у вас) на их представление.
Если навыков программирования нет, то такую задачу на фрилансе возьмутся решить за пару сотен. В дальнейшем через эту программу прогоняйте все тексты, где необходимо произвести замену.
Как программист не вижу проблемы в такой утилите. Рад был бы помочь, но времени, к сожалению нет.
В таком виде, мне кажется не очень желательно размещать текст на сайте.
Сканируйте и распознавайте pdf через FineReader...
так вот поиски такой утилиты не увенчались успехом к сожалению (((
а это то тут причем ??
у меня пдф-ки все не в графике ... а с вполне нормальным текстом ... их распозновать не надо ...
проблема их в html сохранить чтобы исходный код страницы был вменяемым