Aller au contenu principal

Stockage des données

Stockage des données de recherche

À chaque projet de recherche se rattachent des exigences particulières en matière de stockage de données et celles-ci doivent être accordées minutieusement avec les fonctionnalités des plateformes de stockage en place afin de déterminer la solution la mieux adaptée. Ces exigences peuvent comprendre ce qui suit :

  • stockage de grande capacité prévoyant des possibilités d’expansion en continu;
  • stockage de données délicates ou à usage restreint;
  • soutien au calcul et à l’analyse.

Dans certains milieux de la recherche, en particulier ceux qui font intervenir des collectivités autochtones, le stockage des données doit également respecter leurs préférences en matière de propriété et d’intendance des données. Par exemple, les collectivités en question peuvent demander que le stockage des données repose sur l’infrastructure qui leur appartient, plutôt que sur celle d’une université, ce qui leur assure la possession et la surveillance des données. Les chercheurs qui s’intéressent à cette approche peuvent consulter le Privacy and Security Policy Manual, né de l’Initiative de gouvernance des données des Premières Nations de la Colombie-Britannique. Ce guide pratique offre des modèles de politique sur le stockage des données.

Pour ce qui est du choix du milieu de stockage idéal, les chercheurs sont invités à consulter le Localisateur de stockage des données de recherche, une ressource interactive qui, mise au point par le Service de la bibliothèque et des archives, répertorie les options recommandées en matière de stockage et de sauvegarde.

D’une manière générale, les plateformes de stockage de données se classent en trois catégories principales, chacune ayant ses avantages et ses limites.

Le stockage local s’entend des dispositifs (disques durs internes ou disques statiques à semiconducteurs) intégrés à l’ordinateur du chercheur ou directement connectés à celui-ci (disques durs externes, clés USB, DVD et autres supports matériels).

Principaux avantages

  • Facilité d’emploi : Les disques externes peuvent être connectés directement à un ordinateur et mis au travail immédiatement, sans le concours d’un logiciel spécialisé ni la configuration d’un compte utilisateur.
  • Vitesse de transfert élevée : Les données peuvent être écrites sur les périphériques locaux ou extraites de ceux-ci très efficacement.
  • Caractère abordable des besoins de capacité modérée : Les dispositifs locaux de stockage – volumes de données d’environ 10 téraoctets – sont relativement peu coûteux.
  • Portabilité : Les dispositifs externes sont assez faciles à débrancher et à transporter.
  • Accessibilité hors ligne : L’accès aux données, toujours libre, ne dépend d’aucune connexion à Internet.
  • Accès physique restreint : Seules les personnes en possession directe du dispositif peuvent accéder aux données qui y sont stockées. Le contrôle des projets à petite échelle s’en trouve donc amélioré.

Le stockage en réseau se fait au moyen de dispositifs connectés à un réseau local ou institutionnel, plutôt que par connexion directe à un seul ordinateur. Ce genre de stockage dépend en général du Service de la TI du campus ou de chercheurs individuels qui recourent à des technologies comme le stockage en réseau (NAS). Les dispositifs NAS, en particulier, sont conçus pour se connecter par l’entremise d’un réseau plutôt que d’une interface ordinateur directe.

Principaux avantages

  • Accès sous contrôle : Les données, accessibles sur le serveur ou le réseau institutionnel désigné, ne le sont qu’aux seules personnes autorisées à s’y connecter.
  • Travail collaboratif centralisé : Le stockage en réseau facilite le partage d’accès entre plusieurs chercheurs, groupes ou équipes, collaborateurs à un projet.
  • Fonctions de sauvegarde : Le stockage en réseau prend en charge les processus de sauvegarde automatisés ou ordonnancés, une mesure de protection fiable contre la perte de données.

Le stockage en nuage se dit des plateformes qui hébergent des données en ligne et permettent l’accès à distance au moyen de l’Internet. Les fournisseurs peuvent être des entreprises (Dropbox, Google Drive, Microsoft OneDrive, etc.) ou des producteurs de logiciels libres (SeaFile, OwnCloud, NextCloud, etc.) que peuvent mettre en œuvre des organisations ou des instituts de recherche.

Principaux avantages

  • Contrôle des versions et récupération des fichiers : La plupart des services gardent l’historique des modifications, ce qui veut dire que la reprise des versions antérieures des documents et le rétablissement des fichiers supprimés sont possibles.
  • Partage de fichiers et collaboration : Les plateformes nuagiques facilitent, outre l’édition et l’annotation conjointes de fichiers, le partage transparent entre collaborateurs.
  • Accessibilité universelle : Les données sont accessibles de n’importe quel périphérique disposant d’une connexion Internet, où que l’on se trouve.

Limites à considérer

  • Vitesse d’accès : Les fichiers peuvent devoir être téléversés avant l’analyse, ce qui peut ralentir les flux de travail lors du traitement de grands ensembles de données.
  • Risques liés à la sécurité : Le stockage en nuage exige des protections rigoureuses comme des mots de passe complexes ou singuliers et une protection permanente des comptes. Des vulnérabilités, notamment le risque d’atteinte à la plateforme ou d’accès non autorisé, subsistent.

La sécurité des données, comme son maintien, est un élément essentiel d’une gestion responsable des données de recherche. Le tableau ci-dessous indique en quoi consiste l’emploi de 7-Zip – pour le cryptage des fichiers et des dossiers – et de Cryptomator pour le cryptage des données stockées en nuage. Bien entendu, l’accent est mis sur les meilleures pratiques actuelles dans les contextes d’utilisation individuelle et collaborative.

Pourquoi le cryptage?

  • Parce qu’il protège les données de recherche délicates et confidentielles contre tout accès non autorisé.
  • Parce qu’il y va de la conformité aux obligations institutionnelles, juridiques et éthiques relatives à la sécurité des données de recherche.

Outils recommandés

Caractéristique7-ZipCryptomator
Coût/licenceGratuit, source libreGratuit, source libre
PlateformesWindows, Linux (CLI)Win, Mac, Linux, Mobile
ChiffrementCryptage AES-256 sur toute l’archive; cryptage des noms en optionCryptage AES par fichier; cryptage transparent des dossiers en nuage
Utilisation principaleCryptage et compression de fichiers/dossiers locauxSynchronisation sécurisée en nuage (p. ex., Google Drive)
PartageEnvoi d’archive chiffrée et du mot de passePartage du dossier coffre-fort en nuage + mot de passe du coffre-fort
Exploitation nuagiqueNon optimisé pour le nuage ni pour les fichiers/dossiers locauxConçu en mode nuage, mais exige Google Drive pour que l’ordinateur de bureau se mette en mode « miroir »
Emplacement téléchargement7Zip DownloadCryptomator Download