- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Подскажите чайнику. fopen читает кракозябры.
Покопался в поиске, вопрос популярный, но ответов нет. Есть много советов, типа воспользоваться поиском и изучить какой-то мануал.
Нужно просто прочитать одностраничный pdf и занести текст в блокнот для индексации. Для поиска нужно.
Есть ли готовый оператор или функция?
Или надо для этого писать скрипт с библиотеками?
---------- Добавлено 18.05.2013 в 13:13 ----------
Пробую воспользоваться вот этим http://php.net/manual/en/book.pdf.php
Но пока не получается.
Что именно не получается? Библиотека скомпилирована в PHP?
Библиотека скомпилирована в PHP?
Нет. Не знаю где взять библиотеки и, тем более, как и куда их подключить..
Не знал, что это так сложно....
Все примеры скриптов из мануала тормозятся ошибкой на первой же строчке $pdf = pdf_new();
---------- Добавлено 18.05.2013 в 14:42 ----------
Насколько я понял из различных переписок на форумах, проблема чтения pdf до конца не решена.
Это так? Или я вообще ничего в этом не понимаю.
Мне подойдёт самый упрощённый вариант, без восстановления структуры строчек и координат. Просто куски текста, отдельные фразы и слова в произвольном порядке. Они будут использоваться как ключевые при поиске.
fordzon, все нормально работает, если подключена соответствующая библиотека. В вашем случае, вы вызываете несуществующие функции обработки PDF. А они не существуют соответственно потому, что вы не подключили библиотеки функций. :)
Вариант А:
просим хостера подключить библиотеку
Вариант Б:
На локальном сервере ставим библотеку, парсим текст, добавляем на хостинг
Вариант В:
Перепечатывает текст в блокнот:D
Вправо и влево я плохо понимаю, пальцем бы кто показал....
Библиотеку скачал отсюда http://www.fpdf.org/
последнюю версию 1.7 , распаковал папку fpdf, рядом лежит файл test.pdf, моя пробная страница test.php и ещё блокнот test.txt
Что надо прописать на страничке, чтоб читабельное содержимое pdf одной строкой поместить в блокнот?
Мои чайниковские мысли в тупике, но если кто напишет скрипт, разберусь.
---------- Добавлено 18.05.2013 в 21:38 ----------
Всё пробую в XAMPP. Но могу проверить на хосте reg.ru и sprinthost.ru
fordzon, это не библиотека, это фреймворк.
Поправьте меня, если ошибаюсь,
но Pdf -это картинка, и врядли что-то адекватное пока создано (или мне не попадалось) на php для распознавания картинок.
Библиотека, которую Вы привели, служит для создания, а не чтения Pdf
http://www.php.net/manual/en/intro.pdf.php
но Pdf -это картинка, и врядли что-то адекватное пока создано (или мне не попадалось) на php для распознавания картинок.
Эм.. откуда информация? Там даже иногда выделение текста работает.. ;)
fordzon, см http://webcheatsheet.com/php/reading_clean_text_from_pdf.php
Ещё есть набор утилит xpdf pdf2text .. если vps - проблем с shell_exec быть не должно.. Если хостинг - может и не подойти
Поправьте меня, если ошибаюсь,
но Pdf -это картинка, и врядли что-то адекватное пока создано (или мне не попадалось) на php для распознавания картинок.
ошибаетесь. ОЧЕНЬ СИЛЬНО при чем :)
---------- Добавлено 20.05.2013 в 02:36 ----------
Все примеры скриптов из мануала тормозятся ошибкой на первой же строчке $pdf = pdf_new();
Там есть требования:
установите для начала либу.
ivan-lev, dkameleon, благодарю! Всегда рад узнать что-то новое.