Informatique décisionnelle
Les fondamentaux
ETL: maîtriser les techniques d’intégration des données
Avis d’expert
L’intégration des données est une étape cruciale dans un projet décisionnel. Elle garantit la fiabilité des indicateurs, la fraîcheur des données et l’adéquation fonctionnelle aux utilisateurs. Faisant souvent office de « cuisine » dans les architectures, il existe néanmoins nombre de fonctionnalités spécifiques au décisionnel, indispensables et incontournables dans les projets. Ce cours de deux jours, vous propose de connaître et de maîtriser toutes ces fonctionnalités à travers leur mise en pratique avec un outil du marché.
Objectifs pédagogiques
- Mesurer les enjeux et les risques liés à l’intégration des données
- Identifier les fonctionnalités d’intégration de données dans le décisionnel
- Mettre en pratique ces fonctionnalités
- Définir une démarche d’intégration des données
Public
Chef de projet décisionnel
Architecte
Toute personne amenée à concevoir et mettre en œuvre l'environnement d'aide à la décision.
Pré-requis
Connaissance de base du Système d’Information.
Connaissance des environnements d’aide à la décision souhaitée.
Méthode pédagogique
Formation rythmée par des apports théoriques et des études de cas.
Programme pédagogique détaillé par journée
Jour 1
Jour 2 Les notions de bases
Le rôle de l’ETL pour l’alimentation d’une base décisionnelle.
L’ « Operational Data Store ».
La « Data Staging Area ».
L’ETL : “Extract Transform Load”.
Le référentiel ou dictionnaire de données.
La connexion aux sources de données.
L’import des métadonnées.
Les catégories d’outils ETL : les générateurs de code et à moteur de transformation.
Le « projet ETL ».
Les techniques de transformation
Le « mapping » des données.
La dérivation des données.
Le « look-up ».
Le « pivot ».
Le « merge » de fichiers.
Le « slowly changing dimension ».
Les clés de substitution.
Les variables et paramètres.
L’aplatissement des hiérarchies.
La gestion des rejets.
Les fonctionnalités avancées
Les options de mise à jour des données.
Les dimensions statiques et dynamiques.
La création/suppression des tables.
Le débogage ligne à ligne.
Le « mode trace ».
L’audit des données.
La capture des données modifiées.
Le « scripting ».
L’administration des flux
La gestion des environnements et des utilisateurs.
La portabilité des projets.
La génération documentaire.
La planification des flux.
L’ordonnancement des flux.
La démarche de mise en œuvre
La répartition des rôles entre développeur et administrateur.
Le modèle de spécification des flux.
Exemple de planning type.
Conclusion
Synthèse des principaux messages.
Références pour approfondir.











2 jours - 14 heures



