Trois chantiers pour bien «nettoyer» ses données d’entreprise

Offert par Les Affaires

Publié le 05/11/2021 à 11:46

Trois chantiers pour bien «nettoyer» ses données d’entreprise

Offert par Les Affaires

Publié le 05/11/2021 à 11:46

Par Philippe Jean Poirier

Adlene Sifi, directeur des services-conseils de la firme Momentum technologies (Photo: courtoisie)

 

Tous les experts en science des données le disent : pour espérer avoir du succès dans un projet d’intelligence d’affaires, une entreprise doit pouvoir compter sur des données « de qualité ». Ces mêmes experts ne cessent de répéter qu’il faut « nettoyer » les données avant de songer à les exploiter. Voici donc trois chantiers à entreprendre afin d’obtenir des données d’affaires valorisables.
1. Définir un vocabulaire commun
Chaque service d’une même entreprise possède son propre jargon. L’un désignera ses recettes par l’expression « total des ventes », alors que son voisin parlera de « revenus ». L’un inclura les taxes, alors que l’autre non. « Une entreprise qui veut valoriser ses données doit d’abord mettre en place un glossaire de celles-ci », précise Adlene Sifi, directeur des services-conseils de la firme Momentum technologies. 
Au terme de cet exercice, l’ensemble des services s’entendront sur un « vocabulaire commun », compris et partagé par tous. Fanny Leroux, experte en science des données et analytique d’affaires au Centre de recherche informatique de Montréal (CRIM), propose aux PME de commencer par un exercice simple : écrire la définition et la description des données utilisées dans l’entreprise, ainsi que les « domaines de valeurs » des éléments qui les composent. « Un véhicule peut par exemple avoir plusieurs types de modèles », illustre-t-elle. Les connaissances ainsi recueillies peuvent ensuite être partagées avec toutes les personnes concernées, qui parleront alors le même langage.
2. Établir un mécanisme de traçabilité 
Plus de neuf entreprises sur 10 (92 %) utilisent plus d’un fournisseur d’infonuagique, selon un sondage mené en 2021 par la firme américaine de logiciels Flexera auprès de 750 décideurs en technologie de l’information (TI). « Cela signifie que les données sont éparpillées dans plusieurs centres de données, à l’intérieur de bases de données qui n’ont pas toujours le même langage de programmation », explique Adlene Sifi. Ce genre d’environnement informatique est beaucoup plus complexe à gérer qu’un simple serveur local, insiste-t-il.
Pour garder le contrôle sur ses données, une entreprise doit pouvoir les « retracer » en tout temps. Elle doit donc avoir établi un mécanisme de traçabilité, soit un « processus permettant de créer une sorte de cartographie pour connaître l’origine et les étapes suivies par une donnée ainsi que la manière et la raison de l’évolution de cette dernière au fil du temps », comme le définit la firme informatique Talend, basée en Californie.  
« La traçabilité des données implique de comprendre où sont les données, qui les manipule et comment on les transforme », résume Fanny Leroux. Un des buts de cette démarche est d’éviter qu’un service utilise des bases de données qui ne sont pas à jour ou dont les paramètres lui sont méconnus afin d’établir ses projections d’affaires, illustre l’experte du CRIM. 
Cartographier les données d’une entreprise permet aussi d’éliminer les informations présentes en double ou en triple dans les bases de données. Inversement, cette action aide à repérer s’il y a des données manquantes dans certains champs ou variables mesurés par l’entreprise.
Fanny Leroux donne l’exemple d’un employé qui crée un nouveau compte client pour un client déjà existant parce qu’il ne trouve pas son nom dans le système, où il est inscrit avec une orthographe différente. « On se retrouve alors avec deux comptes contenant chacun des informations partielles », relève-t-elle.
3. Réfléchir au cycle de vie
« Les données ont un cycle de vie, rappelle l’experte du CRIM. Elles sont collectées, transformées, elles peuvent être archivées et, éventuellement, détruites. » 
Arrive effectivement un moment où il faut songer à détruire des données, surtout lorsqu’il s’agit de renseignements personnels. La brèche de sécurité informatique survenue chez Olymel à l’automne 2020 en montre l’importance. Une femme ayant travaillé pendant six semaines pour l’entreprise à l’été 1999 a ainsi reçu début 2021 une lettre l’informant que ses informations personnelles avaient été compromises, rapportait Radio-Canada en février. Depuis cet incident, Olymel semble toutefois déterminée à adopter une meilleure « hygiène numérique ». Son porte-parole Richard Vigneault a annoncé à la société d’État au moment de son reportage que la nouvelle politique de conservation des données personnelles de l’entreprise permettrait de potentiellement détruire « un grand nombre d’informations et de données personnelles ».
Par ailleurs, si les entreprises ne détruisent pas déjà leurs données par hygiène numérique – ou pour libérer de l’espace sur leurs serveurs –, elles devront bientôt le faire pour des raisons légales. « Lorsque les fins auxquelles un renseignement personnel a été recueilli ou utilisé sont accomplies, la personne qui exploite une entreprise devra le détruire ou l’anonymiser », stipule l’article 23 de la nouvelle Loi modernisant des dispositions législatives en matière de protection des renseignements personnels, adoptée en septembre dernier. Les entreprises ont jusqu’au 22 septembre 2023 pour se conformer à cette disposition de la Loi 64. 

 

CYBERSÉCURITÉ DES PME. Tous les experts en science des données le disent : pour espérer avoir du succès dans un projet d’intelligence d’affaires, une entreprise doit pouvoir compter sur des données « de qualité ». Ces mêmes experts ne cessent de répéter qu’il faut « nettoyer » les données avant de songer à les exploiter. Voici donc trois chantiers à entreprendre afin d’obtenir des données d’affaires valorisables.

 

1. Définir un vocabulaire commun

Chaque service d’une même entreprise possède son propre jargon. L’un désignera ses recettes par l’expression « total des ventes », alors que son voisin parlera de « revenus ». L’un inclura les taxes, alors que l’autre non. « Une entreprise qui veut valoriser ses données doit d’abord mettre en place un glossaire de celles-ci », précise Adlene Sifi, directeur des services-conseils de la firme Momentum technologies. 

Au terme de cet exercice, l’ensemble des services s’entendront sur un « vocabulaire commun », compris et partagé par tous. Fanny Leroux, experte en science des données et analytique d’affaires au Centre de recherche informatique de Montréal (CRIM), propose aux PME de commencer par un exercice simple : écrire la définition et la description des données utilisées dans l’entreprise, ainsi que les « domaines de valeurs » des éléments qui les composent. « Un véhicule peut par exemple avoir plusieurs types de modèles », illustre-t-elle. Les connaissances ainsi recueillies peuvent ensuite être partagées avec toutes les personnes concernées, qui parleront alors le même langage.

 

2. Établir un mécanisme de traçabilité 

Plus de neuf entreprises sur 10 (92 %) utilisent plus d’un fournisseur d’infonuagique, selon un sondage mené en 2021 par la firme américaine de logiciels Flexera auprès de 750 décideurs en technologie de l’information (TI). « Cela signifie que les données sont éparpillées dans plusieurs centres de données, à l’intérieur de bases de données qui n’ont pas toujours le même langage de programmation », explique Adlene Sifi. Ce genre d’environnement informatique est beaucoup plus complexe à gérer qu’un simple serveur local, insiste-t-il.

Pour garder le contrôle sur ses données, une entreprise doit pouvoir les « retracer » en tout temps. Elle doit donc avoir établi un mécanisme de traçabilité, soit un « processus permettant de créer une sorte de cartographie pour connaître l’origine et les étapes suivies par une donnée ainsi que la manière et la raison de l’évolution de cette dernière au fil du temps », comme le définit la firme informatique Talend, basée en Californie.  

« La traçabilité des données implique de comprendre où sont les données, qui les manipule et comment on les transforme », résume Fanny Leroux. Un des buts de cette démarche est d’éviter qu’un service utilise des bases de données qui ne sont pas à jour ou dont les paramètres lui sont méconnus afin d’établir ses projections d’affaires, illustre l’experte du CRIM. 

Cartographier les données d’une entreprise permet aussi d’éliminer les informations présentes en double ou en triple dans les bases de données. Inversement, cette action aide à repérer s’il y a des données manquantes dans certains champs ou variables mesurés par l’entreprise.

Fanny Leroux donne l’exemple d’un employé qui crée un nouveau compte client pour un client déjà existant parce qu’il ne trouve pas son nom dans le système, où il est inscrit avec une orthographe différente. « On se retrouve alors avec deux comptes contenant chacun des informations partielles », relève-t-elle.

 

3. Réfléchir au cycle de vie

« Les données ont un cycle de vie, rappelle l’experte du CRIM. Elles sont collectées, transformées, elles peuvent être archivées et, éventuellement, détruites. » 

Arrive effectivement un moment où il faut songer à détruire des données, surtout lorsqu’il s’agit de renseignements personnels. La brèche de sécurité informatique survenue chez Olymel à l’automne 2020 en montre l’importance. Une femme ayant travaillé pendant six semaines pour l’entreprise à l’été 1999 a ainsi reçu début 2021 une lettre l’informant que ses informations personnelles avaient été compromises, rapportait Radio-Canada en février. Depuis cet incident, Olymel semble toutefois déterminée à adopter une meilleure « hygiène numérique ». Son porte-parole Richard Vigneault a annoncé à la société d’État au moment de son reportage que la nouvelle politique de conservation des données personnelles de l’entreprise permettrait de potentiellement détruire « un grand nombre d’informations et de données personnelles ».

Par ailleurs, si les entreprises ne détruisent pas déjà leurs données par hygiène numérique – ou pour libérer de l’espace sur leurs serveurs –, elles devront bientôt le faire pour des raisons légales. « Lorsque les fins auxquelles un renseignement personnel a été recueilli ou utilisé sont accomplies, la personne qui exploite une entreprise devra le détruire ou l’anonymiser », stipule l’article 23 de la nouvelle Loi modernisant des dispositions législatives en matière de protection des renseignements personnels, adoptée en septembre dernier. Les entreprises ont jusqu’au 22 septembre 2023 pour se conformer à cette disposition de la Loi 64. 

À la une

Procter & Gamble revoit à la hausse ses objectifs de rentabilité après un trimestre de bonne facture

Il y a 6 minutes | AFP

Procter & Gamble a affiché un bénéfice net de 3,75 milliards de dollars américains.

Bourse: Wall Street ouvre dispersée pour terminer une mauvaise semaine

Mis à jour il y a 40 minutes | lesaffaires.com, AFP et Presse canadienne

REVUE DES MARCHÉS. La Bourse de Toronto a ouvert en hausse.

Ottawa forcera les banques à identifier clairement les remises sur le carbone

Les premiers dépôts de remise en 2022 étaient étiquetés de manière très générique.