Systèmes de fichiers de nouvelle génération: que chercheront-ils?

L'idée que les données augmentent régulièrement semble un fait universellement accepté parmi les professionnels de l'informatique. Cependant, la grande majorité des discussions sur la croissance des données semblent se concentrer sur les données structurées. Cependant, les données non structurées (données de fichier) augmentent également à un rythme sans précédent. En tant que telles, les technologies utilisées depuis longtemps pour stocker et organiser les données non structurées sont remplies à une vitesse insuffisante.

Systèmes de fichiers de nouvelle génération : que rechercheront-ils ? -%catégories

Bien que je doute sérieusement que beaucoup de gens nieront l'idée que les données non réglementées augmentent, il est facile de réduire la croissance des données. Par curiosité, j'ai regardé le contenu de mon référentiel de fichiers et j'ai découvert qu'il contenait environ 360 000 fichiers. Bien que cela puisse ne pas sembler beaucoup, surtout selon les normes de l'institution, je ne suis qu'une seule personne. De plus, ce nombre n'inclut pas les fichiers OS et n'inclut pas mes archives de données. Si je peux créer 360 000 fichiers (principalement des documents, des captures d'écran et des vidéos) moi-même, imaginez combien de fichiers peuvent être créés dans une grande organisation.

Systèmes de fichiers de nouvelle génération : que rechercheront-ils ? -%catégories

Gestion des contrôles

Il y a, bien sûr, un certain nombre de mesures que les fonctionnaires ont prises pour contrôler l'arriéré des dossiers. Par exemple, le Gestionnaire de ressources Windows Server peut être utilisé pour classer les fichiers et empêcher les utilisateurs d'enregistrer différents types de fichiers sur un partage de fichiers réseau. Par exemple, un administrateur peut choisir de bloquer les fichiers audio ou vidéo. De même, de nombreuses organisations profitent de mécanismes tels que les quotas d'utilisateurs ou les politiques de gestion du cycle de vie des données pour empêcher un grand nombre de fichiers de s'accumuler sur le réseau.

D'une part, je comprends parfaitement pourquoi ces technologies et d'autres technologies similaires sont utilisées. Il y a un coût direct associé au stockage des données et le maintien de la croissance des données permet de contrôler les coûts. Pendant ce temps, cependant, les institutions découvrent de plus en plus que leurs données banales semblent avoir une valeur commerciale auparavant cachée en attente d'ouverture. Si les données sont potentiellement précieuses pour l'entreprise, il est insensé d'imposer des restrictions sévères à la capacité des utilisateurs à enregistrer des fichiers ou à forcer la suppression des anciennes données.

Lisez aussi:  Comment ajouter des amis sur Discord pour ordinateur et mobile

Bien sûr, la croissance illimitée des données non structurées présente d'autres problèmes qui dépassent les coûts de stockage. Le plus grand défi peut être de garder les données organisées. Les organisations doivent réfléchir à la meilleure façon d'aider les utilisateurs à localiser le fichier dont ils ont besoin lorsqu'ils le stockent parmi des millions d'autres fichiers dans le système de fichiers.

Classification basée sur les dossiers comme solution de système de fichiers?

Systèmes de fichiers de nouvelle génération : que rechercheront-ils ? -%catégories

Traditionnellement, la meilleure façon de garder les données quelque peu organisées a été de créer une classification dans la structure du répertoire. Dans ma propre organisation, par exemple, j'utilise des noms de dossier de niveau supérieur qui décrivent le contenu du dossier en général. Ces noms incluent des éléments tels que des articles ou des œuvres. À partir de là, je crée une série de sous-dossiers qui aident à mieux organiser l'information. Par exemple, j'ai un dossier de livre pour les livres que j'ai écrits. J'organise l'information dans le dossier Livres en créant des sous-dossiers pour l'éditeur, l'année et le titre du livre.

Le tri par dossier que j'ai créé fonctionne pour ma propre organisation (la plupart du temps), mais ce n'est probablement pas de bonne taille. S'il y a d'autres utilisateurs sur mon réseau, il n'y a aucune garantie que ces utilisateurs conserveront leurs fichiers à l'emplacement correct en fonction de la structure de dossiers créée.

Le plus gros problème avec l'utilisation de la classification basée sur les dossiers est que, quelle que soit l'organisation de la structure des dossiers, il sera difficile de localiser certaines choses. Il y a quelques jours, par exemple, j'avais besoin de trouver le schéma de la caméra d'imagerie thermique que j'avais créé il y a plusieurs années. Je n'avais pas de dossier de niveau supérieur pour l'appareil, et je ne me souvenais pas exactement quand j'ai construit l'appareil. J'ai fini par recourir à l'interface de recherche Windows.

Lisez aussi:  3 façons de supprimer le numéro de téléphone d'Instagram

Heureusement, le contenu du serveur de fichiers est entièrement indexé, mais il reste encore beaucoup de temps pour parcourir les résultats de la recherche. L'utilisation du mot «appareil photo» comme terme de recherche renvoie les résultats d'articles sur les applications qui bénéficient d'appareils photo pour smartphone, le reçu du reflex numérique que j'ai acheté il y a quelques années et une myriade d'autres documents incluant le mot appareil photo.

La raison pour laquelle ce type de recherche est un gros problème est que les résultats sont basés sur le nom et / ou le contenu du fichier (comme les mots dans le fichier de document). La recherche sera probablement plus efficace si vous pouvez rechercher des mots clés à la place.

Que diriez-vous de stocker des choses?

Systèmes de fichiers de nouvelle génération : que rechercheront-ils ? -%catégories

Des solutions cloud génériques comme Amazon AWS et Microsoft Azure résolvent ce problème en utilisant le stockage d'objets au lieu du stockage par blocs. Le stockage d'objets est un système de stockage de fichiers plats (par opposition à une hiérarchie), et est conçu pour une expansion massive. Au lieu d'organiser les fichiers en dossiers, les fichiers peuvent être étiquetés avec des métadonnées, ce qui permet une auto-description et des fichiers faciles à trouver.

L'utilisation des métadonnées a ses avantages, mais elle n'est pas idéale. Par exemple, SharePoint a la possibilité d'appliquer des balises de métadonnées aux documents d'une bibliothèque de documents depuis de nombreuses années. Il y a au moins deux problèmes dans l'utilisation du balisage de métadonnées.

Premièrement, certains utilisateurs laisseront inévitablement des balises vides. Bien que vous puissiez demander le balisage, certains utilisateurs peuvent entrer des ordures dans les champs de données brutes afin de contourner ce qu'ils considèrent comme une exigence ennuyeuse ou complètement inutile.

Lisez aussi:  Comment supprimer des photos de Google Photos mais pas d'iCloud

Le plus gros problème est que la structure de balisage ne s'applique pas bien à tous les documents. Considérez, par exemple, les articles que j'écris. Il peut appliquer des balises comme la date de publication, l'éditeur ou le sujet. Comme mentionné précédemment, les articles ne sont pas le seul type de données sur mon système de fichiers. Imaginez que j'aurais besoin de conserver une copie d'un reçu à des fins fiscales. Il peut ne pas être judicieux d'appliquer la marque postale ou la marque postale sur le reçu.

Je soupçonne qu'à l'avenir le système de fichiers utilisera un mélange de classification et de compilation de métadonnées. Des types de contenu similaires peuvent être regroupés et, par conséquent, une classification basée sur des étiquettes peut être appliquée à chaque groupe, les balises étant spécifiquement conçues pour répondre à l'objectif du groupe. Je ne parle pas de créer un ensemble distinct pour chaque type de fichier ou d'organiser des fichiers SharePoint dans des bibliothèques de documents distinctes. Je parle d'un système de classification intégré au système de fichiers, et il peut être appliqué d'une manière similaire à la liste de contrôle d'accès.

Systèmes de fichiers nouvelle génération: archivage et accès

Bien que le concept de systèmes de fichiers de nouvelle génération soit assez théorique, il répond à certains des principaux défis liés à la gestion de l'organisation des données. Quelle que soit la forme finale du système de fichiers demain, il devra certainement inclure des technologies de réduction des données telles que l'annulation des données en double (déjà dans NTFS) et une fonction d'archivage transparente. Cette fonctionnalité permet un transfert transparent des anciennes données accédées à un système d'archivage tout en permettant aux utilisateurs d'accéder aux données de la manière habituelle si le besoin s'en fait sentir. Encore une fois, il existe des produits qui peuvent le faire aujourd'hui, mais je parle d'inclure ces capacités dans le système de fichiers.

Vous pourriez l'aimer aussi