Cours sur le web profond

Objectif du cours: Comprendre le fonctionnement du deep web et être capable d'y faire des recherches en toute sécurité.

Partie théorique:

I- GENERALITES SUR LE WEB:

I.1- LE WEB SURFACIQUE: * Le web surfacique désigne la partie du web accessible au grand public.Il contient toutes les pages web indexées par les moteurs de recherche classiques.Néanmoins, il ne représente que 10% de l’information qu’on peut trouver sur Internet.Selon une statistique datée du 14 Juin 2015 , 14.5 milliards de pages web sont indexées par Google.

I.2- LE WEB PROFOND OU DEEP WEB: Le web profond est la partie du web inaccessible par les moteurs de recherche classiques, c’est-à-dire non indexée ou dont le contenu est d’accès limité. On cite par exemple les sites web accessibles via une connexion sécurisée comme les transactions bancaires sur des comptes en ligne ou bien les vidéos à la demande sur Netflix. Que veut dire indexation?*

L'indexation désigne l'action d'un programme utilisé par un moteur de recherche ( Google, Yahoo, Bing,..etc) qui parcourt un site, en copie le contenu et le stocke dans des serveurs. Dans le cas de Google, le robot d'indexation qui s'appelle Googlebot explore les pages web et suit les liens y présents pour découvrir de nouvelles pages. Il copie et enregistre les pages dans les serveurs de Google.

Pourquoi certains sites sont indexés et d'autres non ?

I.3- LE WEB OBSCURE OU DARK WEB: * Le dark web est le contenu du web qui existe sur des réseaux superposés appelés darknets. Ce sont des petits réseaux pair à pair en plus des réseaux Tor, I2P et autres gérés par des entités privées dont le partage est anonyme (les adresses IP ne sont pas partagées publiquement). Ces réseaux utilisent des protocoles spécifiques intégrant des fonctions d’anonymisation. Le dark web constitue une petite partie du web profond.Le contenu du dark web est divers mais souvent illégal: cybercrime,vente et achat de biens ou services illégaux,partage de fichiers confidentiels,...etc .


Source:Wikimedia

II-Fonctionnement de Tor:

Avant de voir ce que c'est que TOR, il convient de s'intéresser aux notions de VPN et de Proxy.

VPN:


Source:Wikipédia * Un réseau privé virtuel, abrégé VPN – Virtual Private Network , est un système permettant de créer un lien direct entre des ordinateurs distants, en isolant ce trafic. Toutes les données que vont s’échanger les utilisateurs seront donc cryptées, à l’aide de différents protocoles(PPTP, L2TP, …) et passeront par un tunnel sécurisé reliant leurs machines.

Proxy:

Tor: Tor est un réseau informatique superposé mondial et décentralisé. Il se compose d’un ensemble de proxies, appelés relais . Ce réseau permet d’anonymiser les paquets TCP .
Dans un réseau Tor, la requête d’un internaute quitte son ordinateur et passe par plusieurs autres ordinateurs présents dans le même réseau et utilisant Tor jusqu’au serveur à qui est adressé la requête. Il est le seul à pouvoir déchiffrer le contenu cette requête .C’est le principe du routage en oignon (qui donne son nom à Tor).Contrairement à un réseau normal, les paquets tor prennent un chemin aléatoire. Le client négocie un ensemble de clés de chiffrement pour chaque nœud emprunté par les paquets.Les figures ci-dessous schématisent le fonctionnement de Tor et le fonctionnement d’un réseau normal:
Réseau normal:

Réseau Tor:

images prises du site de l'Université SupInfo
Tous les échanges entre relais Tor sont sécurisés et cryptés. Tor propose également à ses utilisateurs un ensemble de services cachés sur internet en masquant l’identité (adresse IP, …) du serveur qui les héberge ; ce dernier recevra de Tor une adresse avec l’extension ".onion" (comme par exemple "nomdusite.onion") et ne pourra être accessible que par des internautes du réseau Tor. L’accès d’utilisateurs à un service web caché se fait selon un protocole défini par Tor. * Pour accéder au réseau Tor il faut utiliser le navigateur du même nom : Tor Browser. Le logiciel Tor Browser permet d’aller sur le réseau Tor, et donc de consulter les sites du deep web.

Fonctionnalités de TOR:

Tor propose à ses utilisateurs des fonctions axées sur la vie privée:

  1. Suppression des cookies après chaque session – Tor supprime tous les cookies d’une session juste après sa fermeture.Cette suppression s’assure de ne laisser aucune trace de vos navigations.
  2. Des niveaux de sécurité: Différents niveaux de sécurité sont conçus afin de neutraliser les attaques contre votre navigateur.
  3. Une nouvelle identité :Il est possible de changer totalement votre session de navigateur. Si vous utilisez d’utiliser cette fonction, le navigateur TOR va redémarrer en effaçant toutes les informations de votre navigation.
  4. Accéder à des sites en .onion :C’est l’une des particularités de TOR. Il propose des sites avec une adresse en .onion accessibles uniquement via le navigateur TOR.

III-LE CONTENU DU DEEP WEB:


source: Wikimedia

Aspect juridique du deep web :

L'anonymat protège la vie privée et la liberté fondamentale des utilisateurs mentionnées dans le code civil(article 9) et la Convention européenne des droits de l’homme (article 8).Ainsi, l'utilisation du deep web est tout à fait légitime et n'est pas à l'origine illicite.Les dissidents ou les défenseurs de droits s'y rendent pour communiquer librement dans des Etats qui limitent la liberté d'expression. Néanmoins, les lois sont transgressées au moment où on achète des biens ou des services illicites sur cette plateforme.Par ailleurs, avant d'effectuer un achat en Bitcoin, il faut s'assurer que les exigences réglementaires sont respectées.Les lois concernant le commerce de données par des moyens illicites, le vol de données et leur usage frauduleux sont aussi applicables sur le deep web.
N'oubliez pas que sur le deep web il y a du bon mais aussi le pire, donc soyez extrêmement prudent, patient et choisissez bien les sites que vous souhaitez visiter. Sur le deep web vous êtes seul responsable de vos actes.

Partie pratique:

Dans cette partie, vous allez apprendre à naviguer dans le deep web.
Voici les prérequis pour ce TP:

Maintenant que vous avez téléchargé et installé tous les logiciels, vous allez démarrer votre Tor browser.
Vous vous renderez sur le même site qu'avant depuis Tor pour vérifier que votre adresse IP est masquée.
Si l'adresse IP indiquée par le site est différente de votre vraie adresse, démarrez votre VPN et votre pare-feu.L'antivirus doit être actif.
A présent, vous êtes prêts pour naviguer dans le deep web :wink:

La principale adresse sur Tor est bien The Hidden Wiki. Du même genre que Wikipedia – à l’exception du contenu – The Hidden Wiki vous propose des liens vers différents sites du réseau TOR.C'est un site très essentiel lorsque l’on souhaite explorer le deep web car il permet d’éviter que l’on accède malencontreusement aux sites indésirables.
Pour aller sur le Hidden Wiki, vous n’allez pas entrer au niveau de la barre des titres de notre navigateur une URL de la forme http://www.nomdusite.domaine comme d’habitude dans un navigateur classique, mais plutôt une URL constituée d’une combinaison de lettres et de chiffres suivi de .onion.
Pour se rendre sur le Hidden Wiki, tapez l’adresse « zqktlwi4fecvo6ri.onion » dans la barre des titres de Tor Browser et appuyez sur la touche « Entrée » de votre clavier. Le navigateur vous ouvre une page où est présent un lien (comme le montre la capture ci-dessous), qui vous permettra d’accéder au Hidden Wiki :

Une fois vous cliquez sur le lien « Hidden Wiki », vous êtes redirigés vers la page d’accueil du Hidden Wiki :

Vous y retrouvez un ensemble de liens vers des sites du deep web classés par catégorie (services financiers, services commerciaux, réseaux sociaux, …).

Si vous essayez d’entrer l’URL qui permet d’accéder au Hidden Wiki dans un navigateur conventionnel (comme mozilla firefox, internet explorer, …), le navigateur ne trouvera pas la page désirée :

En parcourant la page d’accueil du Hidden Wiki, vous trouverez un lien vers l’un des meilleurs moteurs de recherche du deep web : Not Evil.

En cliquant dessus le navigateur vous redirige vers le moteur de recherche Not Evil :

Lorsque vous effectuez une recherche sur le moteur de recherche Not Evil, par exemple le mot « deepweb », vous constatez que les liens vers les pages retournées par notre requête ont toutes pour extensions .onion :

A présent vous savez comment explorer le deep web!

Références ##

1-Article sur Wikipédia: Le web surfacique disponible sur https://en.wikipedia.org/wiki/Surface_web
2-Article sur Investopedia: Deep web disponible sur https://www.investopedia.com/terms/d/deep-web.asp
3-Article sur Wikipédia:Darknets disponible sur https://en.wikipedia.org/wiki/Darknet#Uses
4-Article sur wikipédia :VPN https://fr.wikipedia.org/wiki/R%C3%A9seau_priv%C3%A9_virtuel
5-Article sur Wikipédia : Silk road https://fr.wikipedia.org/wiki/Silk_road 6-Article de presse:« Dark web » : une plateforme illégale française démantelée https://www.ouest-france.fr/societe/faits-divers/dark-web-une-plateforme-illegale-francaise-demantelee-5828320 7-Tutoriel sur Openclassrooms https://openclassrooms.com/fr/courses/2939276-surfez-incognito-sur-internet-avec-le-reseau-tor/2954671-vers-un-debut-danonymat-notion-de-proxy
8-Le deep web https://www.supinfo.com/articles/single/3109-deep-web
9-Fonctionnalités de Tor https://meilleurvpn.net/19119/navigateur-tor/
10-COMMENT ACCEDER AU WEB INVISIBLE (DEEP WEB) EN TOUTE SECURITE http://jacquesgoueth.blogspot.com/2015/07/comment-acceder-au-web-invisible-deep.html