PDF-файлыПоисковые роботы в своей работе часто сталкиваются с электронными таблицами, PDF-файлами, презентациями. Об индексируемых страницах в своем блоге рассказал Google. Как оказалось, поисковиком могут быть индексированы тексты из документа PDF, написанные на любом языке. При этом крайне важно, чтобы файлы были не зашифрованы или защищены паролем.

Google может извлекать тексты с применением OCR алгоритмов, даже в случае его представления в виде изображения. Не индексируются картинки в PDF-файлах. Относительно ссылок, их обработка в PDF файлах происходит аналогично обработке ссылок в HTML.

При ранжировании HTML-документы не имеют никакого приоритета. PDF способен занимать высокие позиции в поисковой выдаче. Для этого необходимо наличие качественного контента и ссылок с иных ресурсов. При нежелании владельцев либо вебмастеров появления PDF-файлов в поисковой выдаче, рекомендуется использование X-Robots-Tag: noindex в подзаголовке HTTP.

Отображение подзаголовка в выдаче происходит с применением метаданных title в файлах и текстах анкоров из ссылок, которые указывают на PDF. Для предоставления алгоритмам сигнала о верном названии, рекомендовано обновление обоих элементов.

Похожие записи:

  1. MySpace может стать вкусным обедом для Facebook
  2. В технологию SERP внесены изменения от Яндекс
  3. DST не стать инвестором Twitter
  4. Регистрация доменного имени в зоне РФ может быть аннулирована без суда
  5. Яндекс.Директ может похвастаться 97% высокорелевантных «дополнительных фраз»
  6. Третья версия непрерывной выдачи от Google
  7. Рост выручки Google составил 26%
  8. Апдейты Google: история до наших дней
  9. Yahoo! Может заключить партнерское соглашение с Mail.ru
  10. Google следит за результатами выдачи