La plus grande bibliothèque scientifique du monde : près de 50 millions d’articles et plusieurs millions d’ouvrages

C’est la plus grande bibliothèque scientifique du monde : Sci-Hub héberge près de 50 millions d’articles et plusieurs millions d’ouvrages. Et elle est presque totalement illégale.

Créé en novembre 2011, le site Sci-Hub a graduellement absorbé les corpus de grands éditeurs mondiaux (Elsevier, Springer). Consulté quotidiennement par plusieurs dizaines de milliers de chercheurs, il est devenu une ressource irremplaçable pour les universités de pays en voie de développement.

Tout en mettant à libre disposition des publications très largement subventionnées par des fonds publics, Sci-Hub encourt constamment une suspension définitive.

La page d’accueil de Sci-Hub : http://sci-hub.io/

L’impulsion initiale : le déséquilibre Nord-Sud de la diffusion des connaissances

Sci-Hub est né d’une frustration. En 2009, une chercheuse arménienne installée au Kazakhstan, Alexandra Elbakyan, écrit une thèse sur les procédés de reconnaissance biométrique.

Elle est confrontée à un obstacle récurrent : la plupart des travaux de référence dans son domaine sont coincés derrière des «  paywall  » et ne peuvent être acquis qu’à des tarifs prohibitifs (de 30 à 300 dollars pour un court texte, souvent destiné à n’être consulté qu’une seule fois) : «  Pour moi, même l’achat d’un seul de ces articles pèserait financièrement très lourd.  »

De cette somme, les auteurs des articles ne touchent rien : dans les sciences biologiques, ils paient même très fréquemment pour être publiés. En rachetant systématiquement les revues de référence, dotées d’un « facteur d’impact élevé  », les grands éditeurs comme Elsevier se sont assurés une rente à plusieurs niveaux : en l’absence d’alternative, ils peuvent fixer des droits de lire ou des droits d’écrire à leur guise. C’est ainsi que la recherche scientifique est payée plusieurs fois par l’argent public.

Dans les pays occidentaux, les confrères d’Elbakyan disposent d’accès groupés aux corpus des grands éditeurs. Les universités françaises ont ainsi conclu un accord de «  licence globale  » sur cinq ans avec Elsevier en 2014 pour un montant de 172 millions d’euros. Les universités kazakhes n’ont évidemment pas les moyens de souscrire des offres aussi onéreuses (vu l’ampleur de la facture, certaines universités occidentales y ont d’ailleurs renoncé, à l’image d’Harvard).

Faute de mieux, il reste l’option du piratage.

L’héritage d’une contre-culture du partage

En 2011, Elbakyan découvre un système d’échange d’articles, Fulltext, qui fonctionne à peu près de la même manière que le hashtag clandestin «  Icanhazmypdf  » sur Twitter :

« Les chercheurs sollicitent des articles que leur collègues, disposant d’accès, leur communiquent dans un deuxième temps. Toute personne qui a besoin d’un article de recherche, mais ne peut le payer, peut faire une demande et un autre membre qui peut l’obtenir l’enverra gratuitement par e-mail. Je pouvais obtenir n’importe quel article en le piratant, et j’ai donc répondu à de nombreuses demandes et les gens ont toujours été très reconnaissants. »

Ce « piratage scientifique  » prend appui sur des pratiques anciennes. Jusqu’en 1905 (et, en pratique, jusqu’aux années 1970), les publications périodiques étaient généralement exclues du champ de la propriété intellectuelle. Les universitaires pouvaient diffuser, recopier et republier leurs textes sans avoir à rechercher l’agrément des éditeurs.

Les fondateurs du

Les fondateurs du « Talk Like a Pirate Day » – Mark Summers-John Baur/Wikimedia Commons/CC

Cette ancienne culture du partage est constamment attaquée depuis quarante ans – ainsi qu’en témoignent les virulentes campagnes contre le « photocopillage » dans les années 1990.

Une innovation déterminante : l’automatisation du partage

Elbakyan entreprend de perfectionner ce système rudimentaire, sorte de prolongement web de l’antique réseau de correspondances et de photocopies. En trois jours, Sci-Hub est né.

L’alimentation de la base de données repose sur un stratagème redoutable : si l’article n’y est pas déjà disponible, le lecteur est redirigé vers le serveur de l’éditeur avec des identifiants de connexion communiqués par d’autres chercheurs ; lorsqu’il télécharge le document, Sci-Hub le récupère également et le référence désormais dans sa base de données.

Elbakyan souligne que, par contraste avec les formes antérieures de partage « pirate  », le processus est automatisé :

« Maintenant, les requêtes d’article sont entièrement gérée par des machines et non par les mains d’autres chercheurs. L’automatisation a rendu ce processus très efficace : auparavant quelques centaines de requêtes pouvaient être satisfaites chaque jour ; Sci-Hub est passé à une échelle supérieure de quelques centaines de milliers. »

Le développement de Sci-Hub reposait initialement sur des «  fuites  » massives, à l’image de l’extraction de la base de données JSTOR par Aaron Swartz.

Dans une étude détaillée [PDF] de ces « biblioleaks  », Guillaume Cabanac note ainsi que 12 millions d’articles ont été ajoutés en une seule fois le 30 avril 2013 :

Progression des dépôts sur Sci-Hub (les

Progression des dépôts sur Sci-Hub (les « sauts » correspondent à des « biblioleaks ») – Guillaume Cabanac [PDF]

L’émergence d’une référence mondiale

La popularité du système contribue à son auto-alimentation : près d’un million d’articles sont maintenant ajoutés chaque mois par les utilisateurs. Comme tout système en « peer-to-peer  », Sci-Hub est l’émanation d’une communauté qui entretient et élargit en permanence les rayonnages de cette bibliothèque d’Alexandrie pirate.

Sci-Hub devient rapidement un lieu de savoir privilégié pour des chercheurs situés à l’écart des circuits usuels de distribution des grands éditeurs scientifiques. Les pays de consultation mentionnés par Alexa en témoignent : en tout premier lieu, l’Iran, l’Egypte et l’Indonésie.

Les premiers pays de consultation de Sci-Hub : Iran, Egypte et Indonésie

Les premiers pays de consultation de Sci-Hub : Iran, Egypte et Indonésie – Alexa

En dépit d’accès chèrement payés, les institutions universitaires occidentales ne sont pas beaucoup mieux loties. Les politiques d’abonnements ciblées pénalisent notamment les recherches interdisciplinaires. D’outil périphérique, Sci-Hub s’impose graduellement comme une référence bibliographique mondiale. Les grands éditeurs ne pouvaient plus rester inactifs…

Un « choc » sans incidence : Elsevier vs. Sci-Hub

Le 3 juin 2015, le leader mondial de l’édition scientifique, Elsevier, dépose une plainte contre Sci-Hub à New York. L’entreprise est toute particulièrement concernée : d’après les données compilées par Guillaume Cabanac, près de dix millions d’articles issus de revues d’Elsevier sont ainsi rediffusés. Les représentants de l’éditeur dénoncent [PDF] :

« Les sites référencés sous les noms de domaine sci-hub.org et Libgen opèrent un vaste réseau international pirate en contournant l’accès légal et autorisé à Science Direct [la base de donnée d’Elsevier]. »

Alexandra Elbakyan ne reste pas silencieuse. Elle envoie à la Cour de New York un vibrant plaidoyer pour la libre diffusion des textes scientifiques :

« Elsevier n’est pas le créateur de ces articles. Tous les articles sur leur site ont été écrits par des chercheurs, et les chercheurs ne reçoivent pas d’argent sur ce qu’Elsevier collecte. Cela est très différent de l’industrie de la musique ou du film, où les créateurs reçoivent de l’argent pour chaque copie vendue. »

De manière prévisible, un premier jugement prononcé le 28 octobre est favorable à Elsevier : Sci-Hub constitue un «  piratage  » flagrant de droits de propriété intellectuels bien établis. D’après le juge Robert Sweet, « la solution proposée par Elbakyan aux problèmes qu’elle identifie, simplement rendre un contenu protégé disponible gratuitement sur un site étranger, nuit à l’intérêt du public  ».

L’application du jugement s’avère problématique. Pour l’essentiel, les activités de Sci-Hub sont localisées hors de la juridiction choisie (en Russie et au Kazakhstan) ; alors qu’Elsevier pourrait réclamer des indemnités de plusieurs dizaines de milliards (entre 750 et 150 000 dollars par article), Elbakyan n’y détient aucun bien saisissable. La Cour de New York ne peut qu’entériner le blocage du site aux Etats-Unis — sans empêcher dans l’absolu sa consultation via des proxys ou des navigateurs comme Tor.

L’illustration d’une « guérilla  » multiforme

De toute manière, le procès Sci-Hub vs Elsevier ne constitue qu’une étape dans une véritable « guérilla open access » mise en œuvre par des chercheurs activistes comme Aaron Swartz.

Le piratage de publications ne constitue que l’un des aspects d’un conflit beaucoup plus étendu, qui a pris en 2012 la forme d’une pétition de 15 000 chercheurs contre Elsevier et s’étend aujourd’hui jusqu’au contrôle éditorial des revues, comme l’illustre la dissidence récente des comités éditoriaux de deux revues phares d’Elsevier, Lingua et Cognition.

L’introduction de « lois open access » contribue à faire bouger les lignes. Plusieurs pays ont mis en place des exceptions au droit d’auteur pour les publications scientifiques, permettant de rediffuser les textes sans avoir à solliciter l’accord des éditeurs.

La France envisage actuellement une mesure de ce type dans le cadre de la loi sur le numérique : tout chercheur pourrait republier son article sous une licence non commerciale six mois après sa parution en sciences techniques et médicales, et douze mois en sciences humaines et sociales.

Tout en demeurant la plus grande bibliothèque scientifique du monde, Sci-Hub fonctionnera peut-être dans quelques années en toute légalité.

lien : http://sci-hub.io/