
Depuis 2004, Google puis ses concurrents ont rendus possible l’indexation des contenus des documents PDF en ligne. Evidemment, cela s’est accompagné de nouvelles problématiques pour les webmaster qui se sont retrouvés à manipuler des documents dont ils n’étaient pas nécessairement les auteurs (typiquement, le PDF est la version allégée et optimisée pour l’impression issu d’un document XPress ou InDesign) mais qui pouvait cependant enrichir grandement le contenu de leur site internet.
Dans ce premier cas, si vous le pouvez, demandez à l’auteur de traiter le document remis en réduisant la résolution des images qui généralement sont à 300 dpi (pour une bonne qualité d’impression) et de la réduire à 72 dpi pour un affichage adapté au écrans d’ordinateur. Cela fait généralement baisser considérablement le poids du document final.
Si vous avez la main sur le PDF, voici alors quelques conseils pour qu’ils soient eux-mêmes l’objet d’un bon référencement :
1 – Vérifier que votre document pdf est bien basé sur du texte (et non un gros « .jpg » encapsulé dans le PDF évidemment) car c’est toujours en priorité le texte qui reste signifiant et indexable pour les moteurs de recherche.
2 – Optimiser la copie (conserver les textes sans les vectoriser, les images peuvent elles être dégradées à volonté en fonction de vos besoins).
3 - Compléter les propriétés de votre document (« Menu Fichiers > Propriétés > puis renseigner les différents champs demandés : Titre, Auteur, Mots-clés, voire les méta données supplémentaires… »)
4 - Construire des liens hyper-texte dans le corps du document qui seront bien pris en compte lors de l’indexation.
5 – Attention au placement du lien, lui laisser son attribut « underline » bien sûr et surtout ne pas s’amuser à insérer un lien « caché » qui sera très probablement mal apprécié par le robots indexeur.
6 – Ne pas hésiter à rajouter d’autres balise dans le corps du document : « Options avancées > Accessibilité > Ajouter des balises au document » et spécifier en complément un ordre de lecture« Options avancées > Accessibilité > Retouche de l’ordre de lecture ».
7 – Optimiser la taille des fichiers (« Options avancées > Optimisation PDF »), optimiser la vue rapide web, (« Edition > Préférences -> Internet… ») ainsi les pages seront chargées une par une progressivement.
8 - Faire attention à la version de votre document lors de son enregistrement final (Il y a généralement un décalage entre la dernière version sortie et les capacité des moteurs à restituer ces fichiers… Acrobat 8 étant sorti, il faut donc plutôt des fichiers Acrobat 7 pour être certains qu’ils soient bien interprétés).
9 - Faire attention, à chaque fois que vous éditez votre pdf (même pour de simples détails) de bien vérifier que ces modifications n’ont pas altéré d’autres choses (l’ordre de lecture par exemple…)
10 - Bien nommer votre document pour être bien référencé (un nommage « long » mais plus précis n’est plus gênant comme par exemple « association-xxx-bulletin-inscription-saison-2011.pdf »).
Pour vous rendre compte de la manière dont les robots indexeurs « lisent » les PDF, il vous suffit tout simplement de faire une recherche sur Google sur des document ayant une extension « .PDF » puis de cliquer sur le lien qui les accompagne « Format de fichier: PDF/Adobe Acrobat > Afficher » .Des fonctions similaires existent sur Yahoo! et BING.
Dernière astuce que je préconise personnellement : on peut aussi faire la duplication du document, créer donc une version html en ligne et un lien de téléchargement en bas de page, ce qui reste compatible avec les bonnes pratiques (à la condition bien sûr que ce document ne soit pas trop long…).