Cómo gestiona la Búsqueda de Google los archivos PDF Cómo gestiona la Búsqueda de Google los archivos PDF

Como ellos mismos dicen, Google trabaja para organizar toda la información del mundo y hacerla accesible a todos. Por supuesto, durante este largo esfuerzo, Google encontrará archivos que no son HTML, como hojas de cálculo, presentaciones y PDF. En esos casos, trabajan para encontrar e indexar el contenido correcto para los resultados de búsqueda. No es sorprendente que estos tipos de archivos sean difíciles de indexar. ¿Qué pautas deben seguir? ¿Qué pasa si no quieres que Google los indexe?

Google ha recopilado las preguntas más frecuentes sobre la indexación de PDF y esto es lo que tienen que decir:

P. ¿Google puede indexar archivos PDF? R: Google generalmente puede indexar contenido textual escrito en cualquier idioma a partir de archivos PDF. Sin embargo, no deben estar protegidos con contraseña ni encriptados. Google puede procesar imágenes incrustadas con texto usando algoritmos OCR. Google debería poder indexar el texto que puede copiar de documentos PDF a documentos de texto estándar.

P. ¿Cómo se tratan los documentos PDF con enlaces? R: Los enlaces en archivos PDF pueden pasar PageRank y otras señales de indexación y Google puede rastrearlos una vez que ha rastreado el archivo. Actualmente no es posible incrustar hipervínculos nofollow en un archivo PDF.

P. ¿Cómo puedo evitar que mis archivos PDF aparezcan en los resultados de búsqueda?R: Es fácil evitar que los documentos PDF aparezcan en los resultados de búsqueda. Para hacer esto, agregue la etiqueta X-Robots: noindex al encabezado HTTP que servirá el archivo. Si los documentos PDF ya están indexados, desaparecerán con el tiempo si se utiliza la etiqueta X-Robots-Tag con la directiva noindex. También puede usar la herramienta de eliminación de URL en las Herramientas para webmasters de Google para una eliminación más rápida.

P. ¿Pueden los archivos PDF ocupar un lugar destacado en los resultados de búsqueda? R: ¡Claro! Se clasificarán como cualquier otro sitio web. Todos los documentos PDF devueltos por el motor de búsqueda de Google ocupan un lugar destacado por su contenido y por la forma en que están incrustados y vinculados a otras páginas.

P. ¿Es contenido duplicado si tengo mis páginas tanto en HTML como en PDF? R: Google recomienda mostrar solo una copia de su contenido siempre que sea posible. Si no puede, asegúrese de especificar su versión preferida. Esto se puede hacer incluyendo la URL en su mapa del sitio o especificando su versión canónica en los encabezados HTTP o en el HTML de la fuente PDF.

P. ¿Cómo puedo cambiar el título de mi documento PDF que aparece en los resultados de búsqueda? R: Google usa dos elementos para determinar el título que se muestra: los metadatos del título en el archivo y el texto de anclaje de cualquier enlace que apunte al archivo PDF. Google recomienda actualizar ambos para dar a nuestros algoritmos señales claras sobre el título correcto a usar.

By admin

Leave a Reply

Your email address will not be published. Required fields are marked *