Recherche Google(R)

Tout les internautes connaissent le célèbre moteur de recherche, notamment pour sa vitesse.

Comment peut-il aller aussi vite ?


Google(R) est le moteur de recherche le plus utilisé sur internet.
Il doit sa notoriété à trois facteurs :


  • Sa vitesse
  • Sa précision
  • Ses logos


Nous allons voir ici comment Google fait pour être si précis et si rapide.
Ensuite, nous verrons comment améliorer une recherche Google.

I.Du côté de Google

Généralement, une recherche dure moins d'une demi-seconde.

Pour cela, Google suit un certain nombre de techniques.

1°)Tout d'abord, votre requête est envoyée à un "Web Server".
Celui-ci est l'interface entre le monde internet et les machines Google (en réseau local).
Il se charge d'envoyer votre requête aux "Index Servers".

Ces serveurs-là sont constitués comme la page d'index d'un livre. Ils répertorient les endroits où se situent les informations recherchées.

2°) Une fois arrivée aux "Index Servers", votre requête est dirigée vers les "Docs Servers" qui contiennent toutes les informations recensées par Google.
Grâce au système d'index, Google sait sur quel "docs server" aller pour répondre à votre requête.

3°) Les résultats trouvés dans les "Docs Servers" sont renvoyés vers l'utilisateur, et le tout en moins d'une demi-seconde.

Notes :

  • Google référence à peu près 60% des pages internet.
  • Pour faire le tour du web et tout référencer, les robots de Google mettent environ 1 mois.
  • Google est le moteur de recherche le plus connu et le plus performant


L'autre point de notoriété de Google est certainement ces logos variables selon le jour et l'événement.

C'est Dennis Hwang, un sud-coréen américain qui s'occupe du design de tout les logos Google.

II.Du côté de l'utilisateur

Il existe des astuces afin d'obtenir une bonne recherche Google :

1. Ne jamais mettre de phrases
2. Mettre des mots-clés
3. Mettre les mots-clés entre " "
4. Séparer les mots-clés par des +

Ce sont là les 4 principaux critères d'une bonne recherche.

Maintenant, d'autres astuces :

  • > Si vous souhaitez obtenir les résultats d'une catégorie sauf une sous catégorie (Ex : pays de l'Europe sauf la France)
Séparer les mots-clés à ne pas chercher par des -
      • -> "Pays"+"Europe"-"France"

  • >Si vous ne voulez que les pages d'un certain pays, ajoutez site:(identifiant du pays)
Par exemple : "recherche" site:fr vous renverra les résultats des pages françaises de votre recherche.

Cette liste est non exhaustive.


Source : Google

 
 
~Théonaute~
 

En cas de conflit avec cet article (problème de droits d'auteur, etc.) vous pouvez en demander la suppression auprès d'un administrateur du site.

"Pour faire le tour du web et tout référencer, les robots de Google mettent environ 1 mois."



"Eric Schmidt, le dirigeant de Google, a annoncé hier lors d'une conférence aux États-Unis à Phoenix que le référencement de tout le contenu du monde (uniquement pour les livres en théorie) prendrait environ trois petites centaines d'année. Selon lui, Google n'indexerait que 170 Téraoctets (1000 ou 1024Go, selon la base de calcul), alors que le monde comporterait à peu près cinq millions de To de données !"
www.pcinpact.com, Dimanche 09 octobre 2005 à 09h18, rédigé par Nil Sanyas


~calopsfr~

 

Je viens de lire un article très intéressant dans un magazine de mathématique qui expliquait comment fonctionnait le système de classement par préférences de Google qui a également participé à la notoriété du moteur de recherche. Je n'ai pas tout compris (l'article étant d'un niveau trop haut pour moi) ni tout retenu en détail mais voici ce que je peux préciser :

Les informations que j'ai dévoilées ont été prises du magazine 'Quadrature' #68 (avril-juin 2008).

Une premiere idée avait ete de compter les liens: il est plausible qu'une page importante recoit beaucoup de lien."Avec un peu de naiveté" on pourra croire la reciproque: si une page contient beaucoup de liens alors elle est importante.Malheureusement cela mène a plusieurs inconvenients:

certaines pages importantes a lien unique peuvent etre ignorés ou sous estimées.
on peut artificiellement augmenter l'importance d'une page i en creant des pages "vides de sens" pointant vers i. Cette faiblesse fait du comptage un outil peu fiable.
2. Seconde idée: on pondère le comptage (c'est a dire que l'on attribue, en quelque sorte, une valeur 'd'importance' a chaque lien). Certaines pages j emettent beaucoup de liens: ceux ci sont moins specifiques a la recherche, donc leur poids est plus faible. Toute fois les incovenients ne changent pas et ne sont meme pas supprimé^^: on peut encore et toujours crée des pages vides qui augmenterai le poids de la page.

3. la derniere idée en date est celle utilisée par Google: "une page i est importante si beaucoup de page importantes pointent vers i".Conclusion: avec cette methode la triche ne sert plus a rien. Les pages recoivent correctement leur ponderation (il n'y a plus de sous-estimations possibles) et on aura beau rajouter des liens vides de sens, leur poid valant 0.... il ne contribueront pas au calcul de pertinence du site.

Pas si simple que ca de faire un bon site!

PS: je tiens a preciser que ce qui a fait la notorieté de google c'est sa facilité d'utilisation: page principale: rien, un grand vide avec un logo et un champs de recherche. facile. avouez que c'estnettement mieux que free.fr ou yahoo... où la page est remplie a ras bord.

~Echtros~

 

Fait nouveau : Google viens de breveter sa page d'accueil si simple.

~guidouil~

 

Il faut être membre du site afin de pouvoir rajouter un complément d'information sur un article.