Гугл теперь индексирует сканы?

129

Sutener

28 августа 2010, 18:26

1629

Google научил свой поисковик индексировать отсканированные текстовые страницы. При этом, текст изображения распознается самостоятельно самой поисковой системой.

ссылка на источник

Erste-Hilfe Kurs in München https://blr-akademie.de/ für Führerschein und Betriebe *.com *.bat *.bat *.яня *.bat *.яня *.com *.bat

33

Agor71

28 августа 2010, 19:09

#1

Интересное нововведение. Жаль только, что большинство SEO-специалистов оно не понадобится, поскольку всё же большая часть предпочитает писать тексты в обычном формате, а не PDF.

А школьные и государственные сайты не так сильно относятся к поисковикам, да и вообще, на мой взгляд, особой популярностью они не пользуются.

Google начал создавать блоки Яндекс индексирует Flash Западные SEO-специалисты сократили затраты

104

_vb_

28 августа 2010, 19:24

#2

14.03.2010 Мэт Катц:

Также есть PDF файлы, основанные на сканированных изображениях. Но здесь, однако, в некоторых ситуациях мы можем запускать OCR (Прим. переводчика: программы распознавания текста в изображениях) для таких PDF.

Может и раньше у них это было, просто не говорили.

Саратовская фракция серча (). Давайте посчитаемся.

73

sunseeker7

28 августа 2010, 19:46

#3

Гугл уже давно индексирует скан. Где только берут эти новости.

Live to Win, Dare to Fail

413

angr

28 августа 2010, 20:53

#4

pdf читался гуглом уже давно, новость баян и больше всего смахивает на спам говно-блога, ТС - категорический незачет!

Требуется СЕО-Специалист в Кишиневе, в офис. ()

129

Sutener

28 августа 2010, 21:09

#5

Неее, блог не мой. Его я сегодня первый раз увидел. Та же самая инфа есть ещё здесь и здесь.

То что пдф гуглом сканируется(и даже бывает в выдаче)-я знаю. Просто я понял так, что гугль теперь и текст с картинок может распознать?

Googlebot не распознает весь Яндекс.Картинки распознает человеческое лицо В Яндекс.Картинках появились тематические

196

Джо Саратини

29 августа 2010, 00:03

#6

PDF бывает разный. Есть "явный" текст (то есть его можно "сохранить как текст" в Акробате, к примеру), а есть кодированный - его можно "увидеть" и вытащить только специальным софтом. Возможно, что говорится именно про такой текст, 100 % утверждать не могу, конечно же.

[Гори в аду, Карл ! (http://neprimirim.net/idi-naxuj-karl.php)] [Последняя резиденция королей (http://proza.ru/2017/02/16/2175)] [Продолжение рассказа В.Цоя "Романс" (http://neprimirim.net/romans-viktora-tsoya-prodolzhenie.php)]

Google: если сайт ранжируется Яндекс.Метрика отключила доступ к Яндекс показывает .pdf и

73

sunseeker7

29 августа 2010, 07:42

#7

Я был связан со сканом с прошлого года, и точно могу сказать что гугл видел как "явный" текст, так и просто необработанные картинки.

804

Jaf4

29 августа 2010, 08:18

#8

Джо Саратини:
PDF бывает разный. Есть "явный" текст (то есть его можно "сохранить как текст" в Акробате, к примеру), а есть кодированный - его можно "увидеть" и вытащить только специальным софтом. Возможно, что говорится именно про такой текст, 100 % утверждать не могу, конечно же.

Кодированный - это "в кривых" наверное, когда текста нет, а используемые шрифты не оговариваются, записывается только вектор (подготовка макетов к печати предполагает как раз такое преобразование, CTRL+Shift+o, Крейт аутлайнс). Такие документы скорее всего и начались распознаваться.

Если в акробате текст можно выделить курсором - это просто текстовый документ. Если нельзя = скорее всего в кривых. Думаю, что именно такой текст и начал распознавать гугл.

New! NVMe VPS от SmartApe.ru (https://goo.gl/eoYYkS)

Яндекс.Метрика научилась распознавать важные Яндекс обновил голосового ассистента Гэри Илш: чтобы RankBrain

55

Ecclesio

30 августа 2010, 12:39

#9

Гугл ещё много чего умеет и не только пдф текст распознавать, помимо пдф, он хорошо хавает картинки .png/.gif с Arial текстом (про другие не знаю), что очень на руку оптимизатору, который прячет свой контент от плагиаторов.

Веб-версия Яндекс.Переводчика научилась распознавать Технология компьютерного зрения заработала Google добавил метки для

S

404

Scaryer

30 августа 2010, 12:49

#10

Jaf4, бывает защищенный pdf - пока не введешь пароль, нельзя скопипастить или распечатать.

Google: E-E-A-T не является фактором ранжирования

Все что нужно знать о DDоS-атаках грамотному менеджеру