Des outils pour faire de l'or avec le Big data

Publié le 14/01/2012 à 00:00

Des outils pour faire de l'or avec le Big data

Publié le 14/01/2012 à 00:00

L'expression big data, ou «données volumineuses» en français, sera sur toutes les lèvres en 2012. Sans surprise, elle est utilisée pour désigner des opérations qui requièrent le traitement d'un très grand volume de données. Dans le monde des affaires, ce sont surtout des logiciels d'informatique décisionnelle (business intelligence) et de prévision de la demande qui tirent parti du traitement d'un aussi grand nombre de données.

Un ordre de grandeur

Les données volumineuses ne correspondent pas à une nouvelle technologie ni même à une nouvelle façon de faire, mais à un ordre de grandeur.

«Les possibilités sont là depuis une vingtaine d'années, affirme Pierre Nadeau, président de Delta Vision, qui a développé son propre logiciel de business intelligence. D'ailleurs, ce n'est pas nouveau que les entreprises accumulent des données et les utilisent pour déceler des tendances.»

Cependant, la croissance phénoménale du volume de données disponibles permet d'aller plus loin que jamais sur cette voie.

Lorsqu'un détaillant utilise Google Analytics pour tenter de comprendre le comportement des clients qui effectuent les plus gros achats sur son site Internet, il ne s'agit pas de données volumineuses. Par contre, lorsqu'un autre détaillant tente de déterminer s'il y a des corrélations entre le code postal des clients, la température, la nature des achats, le nombre de fois que certains mots clés apparaissent dans les médias sociaux et le coût par transaction, on peut sans aucun doute parler de données volumineuses.

Des logiciels qui se parlent entre eux

Pour exploiter les bénéfices des données volumineuses, les entreprises doivent être en mesure d'utiliser l'ensemble des données qu'elles collectent... et qu'elles ont accumulées, le plus souvent par l'intermédiaire de différents systèmes informatiques.

Qui plus est, certaines grandes entreprises choisissent de partager des données entre elles, de manière à augmenter la précision de leurs outils : «Dans le secteur du détail, ce n'est pas inédit que deux concurrents acceptent de partager certaines données ; s'ils font tous les deux plus d'argent, ils ne s'en priveront pas», explique Pierre Nadeau.

Les géants du logiciel, comme Oracle et SAP, proposent de nombreux outils, tels que des logiciels de gestion de la relation client (CRM) et des progiciels de gestion intégrés (ERP) pouvant être intégrés aux logiciels d'informatique décisionnelle du même éditeur. Oracle offre d'ailleurs un produit précisément destiné à répondre à l'engouement pour les données volumineuses, qui comprend aussi bien les logiciels nécessaires que les serveurs.

Transformer le bruit en données intelligibles

Au-delà des données recueillies par les entreprises elles-mêmes, la tendance portant sur les données volumineuses accorde une grande importance aux données externes. Certaines peuvent être issues de banques de données spécialisées, mais la plupart des données externes utilisées proviennent d'une source gratuite et abyssale : Internet.

Des médias sociaux aux blogues en passant par les forums et les sites de nouvelles, de nombreuses données pertinentes peuvent y être recueillies : «Il est relativement facile d'aller chercher des données plus ou moins structurées sur Internet ; le défi, c'est de les organiser en un tout cohérent», prévient Bruno Cloutier, président de Momentum Technologies, une entreprise de services informatiques qui revend les produits Oracle.

Travail considérable

Le travail d'intégration nécessaire pour parvenir à traiter autant de données issues de sources différentes est considérable. Ainsi, les données volumineuses ne sont pas vraiment à la portée des PME : «Au Canada, en ce moment, cela s'adresse surtout aux grandes entreprises», reconnaît Bruno Cloutier. Malgré tout, les données volumineuses pourraient éventuellement être accessibles aux petites.

Grâce à des services comme Amazon Web Services, les entreprises n'ont plus besoin d'acquérir de coûteux serveurs pour être en mesure d'utiliser une application de données volumineuses. Ainsi, avec de bons programmeurs et peut-être même un statisticien, n'importe quelle entreprise peut profiter des données volumineuses. Avec de la chance, elle pourrait même voir plus loin que ses concurrents.

www.lesaffaires.com/blogues/julien-brault

twitter.com/ julien-brault

julien.brault@transcontinental.ca

À la une

Logistique: sale temps pour les entreprises

ANALYSE. Depuis 2020, les crises se multiplient, et les travailleurs du CN et du CPKC pourraient bientôt être en grève.

Les travailleurs du CN et du CPKC se donnent un mandat de grève

Un arrêt de travail au CN et au CPKC simultanément pourrait perturber les chaînes d’approvisionnement.

Bourse: Wall Street salue l’accalmie de l’emploi américain

Mis à jour il y a 38 minutes | lesaffaires.com, AFP et Presse canadienne

REVUE DES MARCHÉS. La Bourse de Toronto prenait plus de 100 points à la fermeture.