- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Google научил свой поисковик индексировать отсканированные текстовые страницы. При этом, текст изображения распознается самостоятельно самой поисковой системой.
ссылка на источник
Интересное нововведение. Жаль только, что большинство SEO-специалистов оно не понадобится, поскольку всё же большая часть предпочитает писать тексты в обычном формате, а не PDF.
А школьные и государственные сайты не так сильно относятся к поисковикам, да и вообще, на мой взгляд, особой популярностью они не пользуются.
14.03.2010 Мэт Катц:
Может и раньше у них это было, просто не говорили.
Гугл уже давно индексирует скан. Где только берут эти новости.
pdf читался гуглом уже давно, новость баян и больше всего смахивает на спам говно-блога, ТС - категорический незачет!
Неее, блог не мой. Его я сегодня первый раз увидел. Та же самая инфа есть ещё здесь и здесь.
То что пдф гуглом сканируется(и даже бывает в выдаче)-я знаю. Просто я понял так, что гугль теперь и текст с картинок может распознать?
PDF бывает разный. Есть "явный" текст (то есть его можно "сохранить как текст" в Акробате, к примеру), а есть кодированный - его можно "увидеть" и вытащить только специальным софтом. Возможно, что говорится именно про такой текст, 100 % утверждать не могу, конечно же.
Я был связан со сканом с прошлого года, и точно могу сказать что гугл видел как "явный" текст, так и просто необработанные картинки.
PDF бывает разный. Есть "явный" текст (то есть его можно "сохранить как текст" в Акробате, к примеру), а есть кодированный - его можно "увидеть" и вытащить только специальным софтом. Возможно, что говорится именно про такой текст, 100 % утверждать не могу, конечно же.
Кодированный - это "в кривых" наверное, когда текста нет, а используемые шрифты не оговариваются, записывается только вектор (подготовка макетов к печати предполагает как раз такое преобразование, CTRL+Shift+o, Крейт аутлайнс). Такие документы скорее всего и начались распознаваться.
Если в акробате текст можно выделить курсором - это просто текстовый документ. Если нельзя = скорее всего в кривых. Думаю, что именно такой текст и начал распознавать гугл.
Гугл ещё много чего умеет и не только пдф текст распознавать, помимо пдф, он хорошо хавает картинки .png/.gif с Arial текстом (про другие не знаю), что очень на руку оптимизатору, который прячет свой контент от плагиаторов.
Jaf4, бывает защищенный pdf - пока не введешь пароль, нельзя скопипастить или распечатать.