Tuesday, June 1, 2010

Travailler avec des sites multilingues

Niveau webmaster : interm�diaire

Un site multilingue est un site dont le contenu est propos� dans plusieurs langues. Il peut s'agir, par exemple, d'une entreprise canadienne dont le site est disponible en fran�ais ou en anglais, ou d'un blog sur le football en Am�rique latine dont le site est disponible en espagnol et en portugais.

En r�gle g�n�rale, si vous ciblez des visiteurs qui parlent plusieurs langues, vous avez int�r�t � cr�er un site multilingue. Si votre blog sur le football en Am�rique latine cible le Br�sil, vous pouvez d�cider de publier votre site uniquement en portugais. Par contre, si vous souhaitez �galement cibler les fans de football en Argentine, vous avez tout int�r�t � proposer aussi votre contenu en espagnol.

Google et la reconnaissance de la langue

Google tente de d�terminer les langues principales de chacune de vos pages. Vous pouvez faciliter cette reconnaissance en vous limitant � une langue par page et en �vitant les traductions sur une m�me page. M�me si Google est en mesure d'identifier plusieurs langues sur une m�me page, il est conseill� de r�diger tout le contenu d'une page (en-t�tes, barres lat�rales, menus, etc.) dans une seule langue.

Notez que Google ignore toutes les informations de langue dans le code, depuis les attributs "lang" aux d�finitions de type de document (DTD). Dans certains �diteurs Web, ces attributs sont cr��s automatiquement. Ils ne sont donc pas suffisamment fiables pour d�terminer la langue d'une page Web.

Un visiteur qui acc�de � Google et lance une recherche dans sa langue s'attend � obtenir des r�sultats de recherche localis�s. C'est � ce moment pr�cis que vous intervenez, en tant que webmaster : si vous d�cidez de localiser le contenu, mettez-le en �vidence dans les r�sultats de recherche en suivant nos conseils ci-dessous.

Anatomie d'un site multilingue : structure de l'URL

Vous n'avez pas besoin de cr�er d'URL sp�ciales lorsque vous d�veloppez un site multilingue. Toutefois, vos visiteurs souhaiteront peut-�tre identifier la section de votre site dans laquelle ils se trouvent simplement en jetant un coup d'�il � l'URL. Ainsi, les URL suivantes indiquent aux visiteurs qu'ils se trouvent dans la section anglaise du site :

http://example.ca/en/mountain-bikes.html
http://en.example.ca/mountain-bikes.html

Avec les URL suivantes, les internautes savent qu'ils visualisent la version fran�aise de la page :

http://example.ca/fr/mountain-bikes.html
http://fr.example.ca/mountain-bikes.html

En outre, cette structure d'URL vous permet d'analyser plus facilement la mani�re dont votre contenu multilingue est index�.

Si vous souhaitez cr�er des URL comportant des caract�res sp�cifiques � d'autres langues, vous devez utiliser le codage UTF-8. Lorsqu'elles sont ins�r�es dans votre contenu, les URL cod�es en UTF-8 doivent contenir les caract�res d'�chappement appropri�s. Pour ajouter manuellement des caract�res d'�chappement dans vos URL, n'h�sitez pas � faire appel � un encodeur d'URL en ligne. Vous pourrez facilement en trouver un sur Internet. Imaginons que nous souhaitions traduire l'URL suivante de l'anglais vers le fran�ais :

http://example.ca/fr/mountain-bikes.html

L'URL en fran�ais pourrait se pr�senter de la mani�re suivante :

http://example.ca/fr/v�lo-de-montagne.html

Cette URL contient un caract�re sp�cifique au fran�ais avec "�". Vous devez donc utiliser les caract�res d'�chappement appropri�s dans le lien affich� sur vos pages, comme suit :

http://example.ca/fr/v%C3%A9lo-de-montagne.html

Exploration et indexation de votre site Web multilingue

Nous vous conseillons de ne pas autoriser l'indexation des traductions automatiques. Les traductions automatiques ne sont pas toujours pertinentes et peuvent �tre consid�r�es comme du spam. Autre point encore plus important : un site multilingue est destin� � atteindre une audience plus large en proposant un contenu int�ressant dans plusieurs langues. Si vos visiteurs ne comprennent pas le sens d'une traduction automatique ou si les termes employ�s ne leur semblent pas naturels, demandez-vous si vous souhaitez r�ellement leur proposer ce type de contenu.

Vous avez d�cid� de localiser votre site ? Dans ce cas, vous devez permettre � Googlebot d'explorer facilement chacune des versions de votre site. Pensez � associer les pages dans diff�rentes langues � l'aide de liens internes. En d'autres termes, vous pouvez utiliser des liens renvoyant vers les diff�rentes versions d'un m�me contenu. Ces liens peuvent �galement �tre d'une grande utilit� pour vos visiteurs. Reprenons l'exemple pr�c�dent et supposons qu'un visiteur francophone acc�de � la page http://example.ca/en/mountain-bikes.html. D�sormais, en un seul clic, il peut afficher la page http://example.ca/fr/v�lo-de-montagne.html, o� il visualisera le m�me contenu en fran�ais.

Pour faciliter l'exploration de l'ensemble du contenu de votre site, vous devez �viter les redirections automatiques bas�es sur la d�tection automatique de la langue du visiteur. En effet, celles-ci risquent d'emp�cher les internautes (et les moteurs de recherche) de consulter toutes les versions de votre site.

Enfin et surtout, vous devez utiliser des URL distinctes pour chaque langue. N'employez pas de cookies pour afficher les versions traduites.

Utilisation du codage des caract�res

Google extrait directement le codage des caract�res � partir des en-t�tes HTTP, des en-t�tes des pages HTML et du contenu. A part vous assurer que les informations (contenu et en-t�tes, par exemple) n'entrent pas en conflit les unes avec les autres, vous n'avez pas � vous soucier du codage des caract�res. M�me si Google est en mesure de reconna�tre des codages de caract�res diff�rents, nous vous conseillons de coder autant que possible votre site Web en UTF-8.

Si vous vous m�langez les pinceaux...

Lorsque vous parlez plusieurs langues, il peut vous arriver de vous m�langer les pinceaux. Cette confusion est totalement exclue sur votre site !

Pour plus d'informations, lisez notre post relatif aux sites ciblant plusieurs zones g�ographiques. En attendant, n'h�sitez pas � consulter le forum d'aide et � participer � la discussion !


Post� par Xavier deMorales - Equipe Google Qualit� de recherche

No comments:

Post a Comment