Informatique décisionnelle

Les fondamentaux

ETL: maîtriser les techniques d’intégration des données

Avis d’expert

L’intégration des données est une étape cruciale dans un projet décisionnel. Elle garantit la fiabilité des indicateurs, la fraîcheur des données et l’adéquation fonctionnelle aux utilisateurs. Faisant souvent office de « cuisine » dans les architectures, il existe néanmoins nombre de fonctionnalités spécifiques au décisionnel, indispensables et incontournables dans les projets. Ce cours de deux jours, vous propose de connaître et de maîtriser toutes ces fonctionnalités à travers leur mise en pratique avec un outil du marché.

Objectifs pédagogiques

  • Mesurer les enjeux et les risques liés à l’intégration des données
  • Identifier les fonctionnalités d’intégration de données dans le décisionnel
  • Mettre en pratique ces fonctionnalités
  • Définir une démarche d’intégration des données

Public

Chef de projet décisionnel

Architecte

Toute personne amenée à concevoir et mettre en œuvre l'environnement d'aide à la décision.

Pré-requis

Connaissance de base du Système d’Information.

Connaissance des environnements d’aide à la décision souhaitée.

Méthode pédagogique

Formation rythmée par des apports théoriques et des études de cas.

Programme pédagogique détaillé par journée

Jour 1
Jour 2


Les notions de bases

Le rôle de l’ETL pour l’alimentation d’une base décisionnelle.

L’ « Operational Data Store ».

La « Data Staging Area ».

L’ETL : “Extract Transform Load”.

Le référentiel ou dictionnaire de données.

La connexion aux sources de données.

L’import des métadonnées.

Les catégories d’outils ETL : les générateurs de code et à moteur de transformation.

Le « projet ETL ».

Les techniques de transformation

Le « mapping » des données.

La dérivation des données.

Le « look-up ».

Le « pivot ».

Le « merge » de fichiers.

Le « slowly changing dimension ».

Les clés de substitution.

Les variables et paramètres.

L’aplatissement des hiérarchies.

La gestion des rejets.

 

Les fonctionnalités avancées

Les options de mise à jour des données.

Les dimensions statiques et dynamiques.

La création/suppression des tables.

Le débogage ligne à ligne.

Le « mode trace ».

L’audit des données.

La capture des données modifiées.

Le « scripting ».

L’administration des flux

La gestion des environnements et des utilisateurs.

La portabilité des projets.

La génération documentaire.

La planification des flux.

L’ordonnancement des flux.

La démarche de mise en œuvre

La répartition des rôles entre développeur et administrateur.

Le modèle de spécification des flux.

Exemple de planning type.

Conclusion

Synthèse des principaux messages.

Références pour approfondir.