Module 110 - Analyser et représenter des données avec des outils
Big data: technologies et méthodes permettant de gérer un volumes massifs de données en utilisant des algorithmes pour l' analyser en temps réel. Exemple: Base de données, IoT
Open data: données accessibles librement publiées par des institutions publiques ou privées. CSV, JSON, XML
Les données jouent un rôle crucial dans la gestion et l’amélioration des systèmes informatiques. Elles permettent de :
Le monitoring de données sert à contrôler et détecter les anomalies en temps réel.
La business intelligence (BI) vise à analyser les données historiques pour aider à la prise de décision.
Le monitoring prévient des problèmes avant qu’ils ne deviennent critiques.
La BI exploite les données pour améliorer la stratégie et la rentabilité de l’entreprise
Effectuez l'exercice 1 de la Fiche de travail - Monitoring vs BI
Temps: 10 minutes
Objectifs du monitoring :
Le monitoring aide les équipes chargées des données à identifier l'origine d'un problème, mais ce n'est qu'avec l'observabilité que l'on peut comprendre la cause profonde de ce problème.
L’observabilité cherche à comprendre pourquoi un problème se produit en s’appuyant sur des informations contextuelles.
Principes clés de l’observabilité :
L'observabilité peut être définie comme la capacité à examiner l'état général des données à travers les outils, les serveurs et les applications tout au long de leur cycle de vie.
Le logging ou le journal des données fait référence au processus d'enregistrement des informations et des événements pertinents, ainsi qu'aux changements dans l'activité des données qui se produisent lors de l'exécution des processus d'intégration des données.
L'objectif principal de l'enregistrement de ces événements et de ces changements est de créer un dossier constamment alimenté.
On trouve dans le fichier les détails des erreurs, des anomalies, les détails des interactions avec les utilisateurs, les changements de configuration, les événements liés à la sécurité et les mesures de performance.
Effectuez l'exercice 2 de la Fiche de travail - Monitoring vs BI
Temps: 10 minutes
Face à la croissance exponentielle des cyberattaques, la sécurité est devenue l'un des objectifs majeurs du monitoring.
Les entreprises s'appuient sur des équipes spécialisées (SOC) et des outils de type SIEM (Security Information Event Management) pour surveiller le système d'information, détecter les intrusions et gérer les incidents de sécurité.
Il est important de noter que la sécurité n'est pas l'unique finalité du monitoring, le monitoring répond à 5 autres objectifs :
L’analyse des données repose sur un processus structuré permettant d’exploiter des informations brutes pour en extraire des connaissances exploitables.
Ce processus se divise en quatre étapes principales : l’identification, la préparation, le traitement et la représentation des données.
La mise en place d'un système de monitoring ne s'arrête pas une fois les agents installés. C'est un processus itératif et continu. Un dashboard qui n'est jamais consulté ou une alerte qui ne sonne pour rien ("faux positif") devient rapidement inutile.
Avant de créer des visualisations complexes ou de définir des règles d'alerte, il faut valider la qualité de la donnée collectée. Cette validation passe par 3 étapes clés :
Exemple : Demander au Lead Développeur de confirmer si le pic d'utilisation processeur (CPU) à 90% détecté chaque nuit est une anomalie critique ou simplement le script de sauvegarde habituel. Cela permet d'éviter de configurer une alerte inutile (faux positif) qui réveillerait les équipes pour rien.
Parmi les organisations qui ont adopté de tels outils et pratiques d'intégration de données figurent Netflix, LinkedIn, Uber et AirBnb. Netflix utilise une combinaison d'observabilité, de surveillance et de journalisation pour obtenir des informations sur les performances des services de diffusion en continu et assurer un fonctionnement sans heurts.
De même, LinkedIn met en œuvre la surveillance et le logging pour observer le flux de données de l'organisation et offrir une expérience utilisateur transparente. AirBnb utilise une combinaison de mesures, de journaux et de traçage distribué pour comprendre comment les données circulent dans ses systèmes, optimiser les performances et résoudre les problèmes
1. Téléchargez le dossier Installation.zip qui se trouve sur Padlet
2. Dézippez le dossier
3. Suivez les instructions présentes dans le document Installation.docx