Mettons d'emblée fin à 2 mythes. L'on ne trouve pas tout sur Internet et chercher n'est pas si facile...

C'est pourquoi la bonne connaisssance et la maîtrise des outils et des techniques de recherche estindispensable.Et cela commence aussi quelquefoisen changeant d'outils...

Quels sont-ils ? Que permettent-t-ils de trouver ?

Quelques réponses ici...

 Pourquoi c'est difficile

On trouve tout sur Internet ?

Il suffit d'aller sur Google... et il y a toujours des réponses... Les bonnes ?

Source : Bibliothèques du réseau de l' Université du Québec diffusée sous licence creative commons :
http://creativecommons.org/licenses/by-nc-nd/2.5/ca/deed.fr_CA

D'où proviennent les recherches ?

Le Globe des recherches permet de visionner le nombre de recherches effectuées à un instant T sur la terre entière (mais ce n'est pas du direct).

cerner Pour aller plus loin !

Retrouvez de nombreuses capsules vidéos sur la recherche, toujours réalisées par l'Université du Québec.A découvrir !

lien http://guides.bib.umontreal.ca/

Quels obstacles ?

Infobésité

Il y a trop d'informations !

Quelle que soit la recherche, vous trouvez généralement des milliers, quand ce ne sont pas des millions de réponses. Mais qui peut dire si les bonnes réponses se trouvent à la première, la dixième ou la cent vingt septième page ?

« Trop d'information tue l'information »

nombre de sites

source : www.netcraft.com/

Hétérégonéité

Sites personnels, d'administration, d'entreprises, ici encore la diversité des formes et des types est quasi sans limites et il n'est pas si simple de trouver le type d'information recherchée.

De la même manière, l'on trouve des images, du texte, des vidéos, des sons, et tous ces types peuvent être informatifs...

Absence de structure

pays Le web n'est pas réellement structuré, entendez par là comme, par exemple, la base documentaire du CDI. Vous cherchez un auteur ? Sur e-sidoc, il suffit de chercher dans le champ auteur. Sur le Web, c'est moins évident. La chaîne de caractère cherchée est certes trouvée, mais est-ce bien celle du nom d'un auteur ?

A noter ! Sans même parler du Web sémantique [ 1 ], il existe de nombreuses tentatives de structuration des données. Par exemple celle de Wikipédia sur les pays ou les sociétés qui permet d'afficher directement un encadré structuré dans les résultats d'un moteur de recherche.

Contenus éphémères

Tout change en permanence sur le Web. Tout se créée et, souvent, disparaît aussi vite, sans toujours de possibilité de le retrouver. Les archives du Web sont quasi vides et il n'y a guère que quelques sites, dont par exemple wayback , pour les stocker.

Problème de fiabilité

Avec l'abondance de sites vient aussi celle du copié-collé, de la retranscription approximative, du pillage d'idée. Il est de plus en plus difficile de valider l'information. Les sites personnels peuvent être de très grande qualité et les sites institionnels relayer des idées fausses. Savoir chercher devient de plus en plus important.

  Quels outils ?

Chercher c'est tracer

Chaque fois que vous utilisez un moteur de recherche courant, vos données de recherches (votre adresse IPet les cookies de suivi pour enregistrer vos termes de recherche, la date et l'heure de votre visite, et les liens sur lesquels vous avez cliqués...) sont enregistrées.

plus loin La maîtrise de Google, reste évidemment un incontournable, et cette fiche vous montre de nombreuses possibilités de recherche pas forcément connues de tous.

Ces recherches révèlent une quantité immense d'informations personnelles à votre sujet, comme vos intérêts, votre situation de famille, vos penchants politiques, votre état de santé, etc.
Ces informations constituent aujourd'hui une mine d'or pour les sociétés de marketing, les autorités gouvernementales, les hackers...

Les moteurs de recherche

Les moteurs qui conservent vos données

bing

Bing ( http://www.bing.com/ ) de Microsoft

yahoo

Yahoo ! ( http://fr.search.yahoo.com/ )avec des résultats assez similaires à Bing

Les moteurs qui ne conservent pas vos données

qwant

Qwant ( www.qwant.com/ )qui, contrairement àce que laisse suggérer son nom, est un moteur français.

A Lire, la critique très positive faite par le site Korben": « je suis conquis par cette nouvelle version du moteur sortie mi-avril et Google n'est plus, pour moi, un passage obligé sur le net. »

image lien http://korben.info/

Comment mettre en place la recherche par défaut avec Qwant sur votre navigteur ?

image lien https://blog.qwant.com/

A noter également, Qwant Junior est plus particulièrement destiné aux enfants. Sans publicité et sans accès aux sites pornographiques et aux sites de E-commerce, il est choisit par l'éducation nationale.

image lien https://www.qwantjunior.com/?l=fr

ixquick

Le moteur de recherche le plus confidentiel reste Ixquick . Pas de récupération d'adresse IP, les données personnelles ne sont pas transmises à des tiers.

duckduckgo

Dans le même esprit, citons duckduckgo.com/.

Les moteurs spécialisés

wayback

https://archive.org/ permet de retrouver de vieilles versions de sites ayant changé d'aspect ou des pages disparues

Copyscape

Copyscape ( www.copyscape.com/ )est un moteur de recherche de plagiat sur Internet

ecosia

Ecosia ( www.ecosia.org/ ) reverse 80 %de ses revenus publicitaires à un programme de plantation d'arbres au Brésil.

logo MEM

Le moteur de recherche de l'éducation permet de "limiter"les recherches 350 sites publics de référence de l'éducation nationale.

million short

Million short ( millionshort.com/index.html ) retire automatiquement les premiers 100, 1000, 10.000, 100.000 ou 1 million de résultats.

pickanews

Pickanews ( www.pickanews.com/ ) est un moteur de recherche plurimédia européen indexant plus de 50 000 sources médias (presse imprimée, web, radio et TV).L'abonnement est payant et permet la mise en place d'alertes.

wolfrom

Wolfram est un moteur de recherche et un langage pour les objets connectés et de réponses aux questions (posées en anglais).

Les métamoteurs

Logo Agent

Copernic Agent est un logiciel que l'on installe et qui permet de faire une recherche sur plus de 1000 moteurs. Les résultats sont ensuite triés (élimination des résultats identiques, filtres de recherche, résumés...). Version personnelle gratuite.

image lien Téléchargement : www.copernic.com/fr/

Les annuaires

Au tout début du WEB, les sites étaient classés dans des annuaires, ce qui permettait par exemple de parcourir une arborescence.
Par exemple : Formation -> Enseignement supérieur ->Universités : France -> Université de la Réunion pour trouver 15 réponses en quelques clics.

dmoz

Dmoz (www.dmoz.org/) est un annuaire de pages, classées par catégories et géré par une vaste communauté d'éditeurs bénévoles provenant du monde entier. Depuis le 17 mars 2017, dmoz.org n'est plus disponible, seule une archive reste consultable.

bnf

Les signets de la BibliothèqueNationale de France proposent une sélection commentée de ressources accessibles par Internet, choisies par les bibliothécaires de la BnF, qui les classent et tiennent à jour leur description.

2 principaux modes d'accès permettent de consulter les ressources sélectionnées :

Les encyclopédies et dictionnaires en ligne

Rendus célèbres par l'encyclopédie en ligne Wikipédia, les Wikis, ces outils collaboratifs ont peu à peu gagné le Web.

Plus d'infos Du Web aux wikis : une histoire des outils collaboratifs

Evidemment la première ressource est le plus souvent Wikipédia .Ni diabolique, ni indispensable quoi que quelquefois incontournable, l'essentiel est de savoir l'utiliser à bon escient.

Le principe du Programme de formation à Wikipédia est simple : les éducateurs et les étudiants du monde entier sont invités à contribuer sur Wikipédia et sur les autres projets Wikimédia dans un environnement pédagogique.

 Guide Wikipédia pour contribuer


image lienhttps://upload.wikimedia.org/

Il existe d'autres dictionnaires et encyclopédies en ligne, par exemple :

Pour aller plus loin !

urfist rennes L'urfist de Rennes propose une liste de 80 outils de recherche spécialisés : entres autres recherche de sons, de fichiers, de diapositives, de personnes, d'archives...

Le logiciel documentaire

Qu'est-ce qu'un logiciel documentaire ?

Plus loin Un SGBD (Système de Gestion de Bases de Données) est un logiciel qui prend en charge la structuration, le stockage, la mise à jour et la maintenance d'une base de données. Dans le cas particulier des CDI, le logiciel de gestion et de recherche documentaire, permet, comme son nom l'indique de créer, gèrer, chercher des notices documentaires. De nouvelles fonctionnalités sont aussi souvent proposées (gestion de panier, recherche dans d'autres bases de données, envoi de données...).

Il est de plus en plus souvent en ligne.

Si ces logiciels permettent également des recherches d'information, le plus souvent sur des bases de sites sélectionnés, leur principale fonction est de trouver des documents disponibles au CDI.

notice documentaire

Tous les documents présents au CDI font l'objet de la création d'une notice documentaire, dans laquelle différents champs sont renseignés, notamment le titre, l'auteur, l'éditeur etc. ainsi qu'un résumé indicatif et des mots clés sélectionnés dans un thésaurus.

Un thésaurus est une liste fermée (environ 15 000 entrées reliées entre-elles par une hiérarchie) de mots clés.

L'utilisation d'un thesaurus pour attribuer des descripteurs (mots clés) permet notamment :

Par exemple la recherche suivante
http://9740001h.esidoc.fr/search.php?lookfor=exoplan%C3%A8te&filter[]=format:%22book%22
va faire une recherche avec le mot clé exoplanète mais afficher aussi les fiches contenant le mot planète.

Autrement dit le thesaurus va augmenter les capacités de réponses du système de gestion.

Un livre de recettes culinaires par exemple, ne fera jamais l'objet d'une notice par recettes, ce serait beaucoup trop long à réaliser, mais sera indexé avec le descripteur "  recettes culinaires  ". Et c'est en consultant le document, que l'on pourra vérifier qu'il contient bien la recette recherchée.

Logiciel documentaire et/ou moteur de recherche ?

Une recherche de type documentaire est donc très différente de celle par exemple mise en oeuvre sur Internet. Il y a peu de chance pourqu'il y ait justement LE document qui traite de VOTRE question.

Un fonds de CDI bien doté va comprendre environ 20 000 documents soient 100 000 notices.

Votre recherche va se faire sur 100 000 notices, à partir du titre, de l'auteur, de mots clés, du résumé, du thésaurus...

Autrement dit, si votre (vos) mot(s) clé(s) est contenu dans l'une des notices (ou via une recherche élargie automatiquement dans le thesaurus) la fiche résultat sera affichée.

C'est exactement la même chose avec un moteur de recherhe. Si le mot clé est présent quelque part dans la page Web, y compris sous forme de métadonnées la page est affichée.

La manière de faire une recherche sera forcément différente selon l'outil utilisé.

Les mots clés utilisés avec un logiciel documentaire seront moins nombreux, plus généraux, et saisis au singulier.

Ceux utilisés avec un moteur devront être précis, le plus précis possible, nombreux en gardant toujours à l'esprit qu'ils devront se trouver dans la page résultante.

Le logiciel documentaire du CDI est souvent e-sidoc . En connaissez-vous toutes les possibilités de recherche, d'exploitation de l'information ?

 

Plus loin Près de 91 % des recherches se font via Google en France.

Source : www.lesannuaires.com/annuaire-moteur-de-recherche.html

Les résultats

SEO

L’ optimisation pour les moteurs de recherche, ou SEO ( S earch E ngine O ptimization ) est un ensemble de techniques visant à favoriser le positionnement d'une page Web dans les résultats de recherche des moteurs.

Seules les premières pages étant généralement consultées lors d'une recherche, l'objectif pour tout référenceur ou entreprise de référencement est de vous faire remonter le plus possible dans le classement.

lien http://www.abondance.com/

SEO

Source de l'image: http://www.alltrousers.com/

Le générateur de mots clés de Google permet de se faire une idée sur le nombre de fois qu'un mot clé a été utilisé dans un domaine, voire une langue, une région déterminés.

Plus un mot clé est utilisé, plus le nombre de pages est important.

Adwords

Adwords est un outil de planification de mots clés. Autrement dit la régie publicitaire de Google. Celui-ci affiche des annonces ou bannières publicitaires soit sur Google soit sur le réseau partenaire Display, qui sont ciblées en fonction des mots-clés que tape l'internaute ou en fonction de son comportement de navigation.

Les annonceurs paient lorsque l'internaute clique sur la publicité selon un système d'enchère et de qualité : plus l'annonce sera pertinente pour l'utilisateur, plus le prix au clic sera bas et l'annonce en évidence. Ceci afin d'inciter les publicitaires à fournir des renseignements pertinents par rapport à la demande de l'utilisateur. Les annonceurs paient lorsque l'internaute clique sur la publicité selon un système d'enchère et de qualité : plus l'annonce sera pertinente pour l'utilisateur, plus le prix au clic sera bas et l'annonce en évidence. Ceci afin d'inciter les publicitaires à fournir des renseignementspertinents par rapport à la demande de l'utilisateur.

 

World continents

 

image lien https://adwords.google.fr/KeywordPlanner

adwords A noter ici la notion d'enchère suggérée.
Le C oût P ar C lic (CPC) est le prix que paye un annonceur à Google lorsqu'un internauteclique sur une annonce adwords. Ces annonces sont celles qui sont affichées lors du résultat d'une recherche.
Ce coût va évoluer à la hausse ou à la baisse selon le nombre de clics sur la bannière de pub. Chaque annonceur achète un ou plusieurs mots clés et les gère en fonction du résultat généré.

 

image lien Comment fonctionne Google Adwords ?

Le Web caché

cerner L'essentiel du Web est invisible (en anglais deep web) car non indexé par les moteurs de recherchebien qu'accessible en lignereprésentant 70 à 75 % de l'ensemble. Un moteur comme base permet toutefois des recherches de type bibliographiques. En 2012, 54% des internautes ont recours aux moteurs de recherche contre 32% aux réseaux sociaux pour trouver de nouveaux contenus en ligne.

Voir également le module darknet.