Recherche sur le Web

Objectif : L'idée de ce cours est d'apprendre à effectuer des recherches pertinentes et à savoir exploiter l'information. Tout en s'interrogeant sur les thématiques liés aux recherches Web.

Plan du cours : 1. Rechercher plus efficacement sur le web

a) Les moteurs de recherches

b) Se poser les bonnes questions

c) Les opérateurs de recherche et la recherche sélective
  1. Valider la crédibilité de l’information

  2. Exploiter l’information

    a) Droit de l'auteur

    b) Droit à l'image

    c) Conseils

    d) QCM résolu

  3. Faire des recherches en laissant le moins de traces possible / sécuriser sa navigation

    A) Effacer les traces de sa navigation

    B) Utiliser un moteur de recherche respectant la vie privée

    C) Utiliser un navigateur respectant la vie privée


I. Rechercher plus efficacement sur le web

a) Les moteurs de recherches

Pour multiplier ses chances de trouver rapidement ce que l’on cherche, il faut savoir utiliser les moteurs de recherche... du plus connu aux plus spécialisés. Selon la nature de votre recherche, moteurs de deuxième catégorie, métamoteurs ou annuaires pourront vous offrir d’autres pistes et de nouvelles portes d’entrée sur la Toile.

Moteur de recherche Avantages Inconvénients
Google Le plus performant, meilleur index, algortihme performant, grosse base de données Revenu basée sur la revente de données
Bing (Microsoft) Meilleur alternative à google en terme d'index (Yahoo utilise Bing) Revenu basée sur la revente de données
Exalead (Dassaut) Affiche des termes associés (clusters), ex : Pour la recherche "Telecom Bretagne", on obtient : "Association Telecom Alumni", "Recherche telecom" Revenu basée sur la revente de données
Moteurs de recherches respectueux des données (ex : Qwant & DuckDuckGo) Ne revends pas vos données personnelles Index plus faible
Moteurs de recherches specialisés ex : Google scholar ou Yahoo actualités Recherche très ciblés, simple d'utilisation, possibilité d'alerte mail Dépend du moteur rataché
Métamoteurs (ex : dogpile) Agrégation de résultat de plusieurs moteurs de recherche, affiche un TOP 50 des pages les plus populaires sur le sujet, utile pour démarrer Peu utile aujourd'hui face à la domination de Google
Les annuaires & les signets de bibliothèques (ex: bnf.fr) Repose sur un système de classement, utile pour un travail précis, permet de trouver des sites non indexé Très Forte importance des mots clés
l'Intranet Information propre à l'établissement, non indéxé sur un moteur classique Forte importance des mots clés
Les navigateurs écolo' (ex : Ecosia/Lilo) Reverse une part de leur revenu dans un but écologique Revente de données & index plus faible que Google

b) Se poser les bonnes questions

Contrairement à ce que pensent certains, il ne suffit pas de taper la question, le mot ou l’idée qu’on vous demande de chercher. Si on vous demande par exemple “Quels sont les écoles d'ingénieur les mieux classée en France ?”, vous tapez quoi ?

Si vous tapez école d'ingénieur, vous aurez 33 millions résultats! Google, dans ce cas, cherche toutes les pages, images, vidéos… contenant ces mots individuellement école, ingénieur, mais aussi ensemble école d'ingénieur.

Étape 1 : Faites un remue-méninges sur la question posée. Posez-vous les 6 questions de base : 3QOCP ? (Qui ? Quoi ? Quand ? Où? Comment ? Pourquoi ?). Cela vous permettra de trouver de nouveaux mots-clés.

Recherche : Ecole d'ingénieur en France

Regardez à nouveau les formulations précédentes. Vous remarquez quelque chose ?

Étape 2 : Utilisez des opérateurs de recherche

Et oui, dans les formulations précédentes, vous avez sûrement remarqué les parenthèses ( ) , les mots et / ou / or, les signes + / - …

Ils servent à affiner votre recherche selon vos besoins. Il en existe beaucoup et varient selon le moteur de recherche!

Nous pouvons les tester ! :

Excercice 1 :

Solutions ici : http://exercices.openclassrooms.com/test/22

c) Les opérateurs de recherche et la recherche

Ci-dessous la liste des opérateurs de recherches de google :

On peut notamment réaliser des recherches par type de fichier, cela s'appelle la recherche sélective. La recherche sélective : Type de fichier / type de recherche (ex : définition)

http://www.googleguide.com/advanced_operators_reference.html

Il y a aussi la possiblité d'utiliser l'outil de recherche avancée de google qui peut être plus intuitif pour débuter, mais dont le fonctionnement est le même que les opérateurs.

https://www.google.ch/advanced_search?q=site:hec.unil.ch+&hl=fr


II. Valider l'information

Évaluer une ressource consiste à étudier : -sa pertinence : l'information qu'elle véhicule correspond-t-elle au besoin d'information ? -sa qualité : l'information qu'elle contient est-elle fiable et est-elle bien présentée ?

La pertinence d'une ressource est l'adéquation de son contenu informationnel avec le besoin d'information. Pour cela on peut répondre aux questions suivantes : Le contenu relève-t-il bien du domaine sur lequel porte la recherche ? Le contenu répond-il aux questions posées initialement ? Le contenu apporte-t-il des informations utiles à la recherche au-delà des questions posées initialement ?

La qualité d'une ressource repose sur : La fiabilité de l'information, c'est-à-dire la confiance qu'on peut accorder à sa véridicité ; La qualité de la présentation de l'information, qui recouvre la qualité de la rédaction (structuration de l'information, expression écrite, illustrations), ainsi que sa lisibilité et son accessibilité. * La fiabilité d'une information est liée au contexte dans lequel elle a été communiquée (processus de validation) et à l'intention sous-jacente (commerciale, académique, officielle, etc.).

En pratique, pour évaluer la fiabilité d'une information trouvée sur le web, il faut exercer son sens critique , et poser les bonnes questions.

S'informer sur le site (l'outil whois) Littéralement « who is ? » soit « qui est ? ». Ce service vous permet de pratiquement tout savoir d’un site Internet. Cela vous permet donc de savoir si le site que vous visitez est un vrai ou une arnaque. Et pour utiliser le WHOIS, rien de plus simple. Il vous suffit juste de rechercher « whois + nom du site ». plus de détails : https://whois.icann.org/en/primer

Verification des images

Pour repérer qu’une photo est plus ancienne que sa légende, le premier réflexe est de la passer dans Google Images ou TinEye, des outils qui détectent les occurrences de publication antérieures. Cependant pour avoir plus de détails il est possible de consulter ses metadonnées.

Les Metdonnées:

Lorsqu’une caméra ou un smartphone prend une photo, il intègre automatiquement des données "cachées" dans le fichier qu’il produit. Un fichier .jpeg, ou autre, peut par exemple contenir la date de la prise de vue et la marque de l’appareil utilisé. Certains outils servent à vous simplifier la tâche en extrayant ces données, Et même de placer l’image sur une carte, si la photo a été prise avec un smartphone. Outils : Jeffrey’s Exif viewer: http://exif.regex.info/exif.cgi metapicz : http://metapicz.com/#landing

Par contre, il n’existe pas d’outil aussi puissant pour retrouver les occurrences précédentes d’une vidéo.

QCM :

  1. Quel indice garantit que le site d'un organisme est bien ce qu'il prétend être ?

  2. [ ] L'adresse URL contient le nom de l'organisme

  3. [ ] Le site propose beaucoup d'informations sur l'organisme
  4. [ ] L'adresse du courrier électronique du site contient le nom de l'organisme
  5. [ ] Aucune des propositions ci-dessus

  6. Que vous apprend, sur la ressource qui le contient dans son URL, le code de pays fr (France) ?

  7. [ ] Elle a été créée en France

  8. [ ] L'information qu'elle contient traite de la France
  9. [ ] La ressource est hébergée sur un ordinateur situé en France
Réponse : 4,3

Solutions : http://exercices.openclassrooms.com/test/24 Solutions : http://exercices.openclassrooms.com/test/27 Solutions : http://exercices.openclassrooms.com/test/25

Exemple : https://www.sites.univ-rennes2.fr/urfist/Supports/evaluationinfo/InternetDetective/5_1.html

Pour s'entraîner plus https://www.pedagogie.ac-aix-marseille.fr/upload/docs/application/pdf/2015-07/seance_2_hda_-_fiabilite_de_linformation_eleve_2015-07-08_23-05-6_602.pdf


III. Exploiter l’information

Sur Internet, le Code de la Propriété Intellectuelle (CPI) s’applique aussi. Il faut donc veiller à respecter les droits relatifs aux contenus audio, vidéo, écrits qui sont réutilisés pour une reproduction sur un site, un blog personnel ou dans le cadre d’un travail scolaire. Ces précautions sont autant de réflexes à acquérir pour réaliser des emprunts en toute légalité.

a) Qu’est-ce que le droit d’auteur ?

Internet n'est pas un lieu où tout est accessible ou réutilisable. Cette limitation est due au fait de respecter les droits de l'auteur. Cette opération est appliquée en se renseignant sur les licences sous lesquelles est placé le contenu mis en question (celui qui nous interesse). Le contenu peut être sous différentes formes: graphiques, dessins, photos, textes, programmes d'ordinateurs, œuvres musicales, structure de bases de données...

En France, le droit d’auteur est reconnu à toute personne créant une œuvre de l’esprit, quels que soient son genre (littéraire, musical, artistique), sa forme d’expression (orale ou écrite), son mérite ou sa finalité (but artistique ou utilitaire).

Le symbole © désigne la notion de droit d’auteur dans la législation américaine. A la différence de la France, le copyright doit être déposé pour être valable aux Etats-Unis. En France l’utilisation du symbole © ou la mention « tout droits réservés » n’a qu’une valeur informative car toutes les œuvres sont protégées par le droit d’auteur.

Si le droit moral est inaliénable, les droits patrimoniaux, c'est-à-dire l’exploitation de l’œuvre, peuvent être cédés. Le code de la propriété intellectuelle distingue le droit de représentation qui autorise la diffusion de l’œuvre (y compris sur Internet) et le droit de reproduction qui autorise la reproduction de l’œuvre. Même si l’auteur ne souhaite pas de rémunération, il est plus sage d’avoir une autorisation écrite de ce dernier autorisant la diffusion ou la reproduction de l’œuvre. Le cas se présente par exemple lorsqu’un fournisseur met à disposition de ses clients ses propres photos des produits vendus. Les droits patrimoniaux s’exercent pendant toute la vie de l’auteur et dure 70 ans après l’année civile de son décès au bénéfice de ses ayants droit. Au-delà, l’œuvre tombe dans le domaine public et peut donc être diffusée ou reproduite librement en respectant le droit moral de l’auteur tout de même.

b) Qu’est-ce que le droit à l'image ?

c) Conseils :

Pour réutiliser des œuvres issues d’un site internet, il faut apprendre à trouver le mode d’emploi du site : pour cela, il faut rechercher l’onglet « conditions d’utilisation », « mentions légales » ou encore « crédits », souvent en pied de page du site ou signalés par un logo ou un lien. Ces mentions indiquent qui est le propriétaire des œuvres du site, si elles peuvent être réutilisées et de quelle(s) manière(s). Le directeur de publication d’un site internet est celui qui est responsable des contenus mis en ligne sur son site : vous pouvez vous adresser à lui (c’est-à-dire à une personne, une société, une association…), pour connaitre la façon dont vous devez citer les auteurs des contenus que vous voulez réutiliser si leurs noms ne sont pas clairement indiqués. À défaut d’autorisation de l’auteur ou à défaut de mentions légales sur le site internet, vous pourrez faire un lien simple pointant vers la page d’accueil du site intégrant le contenu ou vers le contenu souhaité (avec indication de l’adresse URL du site lié et mention du nom de l’auteur du contenu, sauf en condition contraire de sa part). L’absence de conditions d’utilisation, de mentions légales ou du nom de l’auteur sur le site utilisé ne signifie pas qu’il y a abandon des droits d’auteur !!! Au contraire, il faut renforcer sa vigilance et chercher à joindre le site pour obtenir une autorisation écrite de l’auteur des contenus utilisés, sous peine de devoir renoncer à son projet de publication. La mention © (ou copyright) vue plus haut, signifie que l’œuvre est la propriété d’un auteur et qu’il y a des droits d’auteur à respecter. En France, cette mention n’a aucune valeur juridique : l’œuvre donne prise au droit d’auteur qu’il y ait ou non le copyright apposé.

d) QCM

Réponses : 2,3,3,3,2,3

IV. Faire des recherches en toute sécurité

A) Effacer les traces de sa navigation

Par défaut, votre navigateur enregistre des informations sur les sites que vous consultez dans des fichiers appelés cookies et stockés sur le disque dur de votre ordinateur. Ces fichiers permettent au site de conserver certaines informations pour éviter d’avoir à les ressaisir, par exemple vos identifiants ou vos informations de facturation. Par sécurité, vous pouvez supprimer ces fichiers dans votre navigateur. Pour apprendre comment supprimer les cookies, lisez cet article : https://www.commentcamarche.com/faq/1999-supprimer-les-cookies Pour en apprendre plus sur le fonctionnement des cookies : https://www.commentcamarche.com/contents/1041-cookies-internet#les-cookies-et-la-securite

B) Utiliser un moteur de recherche respectant la vie privée

Les moteurs de recherche traditionnels comme Google ou Bing enregistre l’historique de vos recherches internet et utilisent ces données pour proposer des publicités ciblées. Il existe cependant des alternatives qui n’enregistrent aucune donnée concernant vos recherches, comme DuckDuckGo ou Qwant.

C) Utiliser un navigateur respectant la vie privée

Certains navigateurs permettent de protéger votre vie privée, par exemple en bloquant les trackeurs qui, sur certains sites webs, enregistrent votre adresse IP pour suivre votre activité. On peut citer notamment Epic Privacy Browser ou UR Browser.

Réferences : https://openclassrooms.com/fr/courses/1757041-faire-une-recherche-sur-internet https://www.letudiant.fr/examen/internet-bien-chercher-pour-bien-trouver/internet-maitriser-les-outils-de-recherche-classique.html