Comment réunir 9 data scientists travaillant sur 5 modèles de vision artificielle et 1 million d'images pour entraîner un modèle d'inspection visuelle et le déployer en production pour la première fois.
ÉNERGIE
SCIENTIFIQUES DE DONNÉES EN CHEF
PRODUCTION À L'ÉCHELLE
L'équipe de science des données d'un grand opérateur énergétique de l'APAC a décidé d'utiliser la vision par ordinateur pour améliorer le processus d'inspection visuelle à distance des réseaux électriques.
Les images sont collectées par des équipes d'opérateurs de drones et des patrouilles à pied dans les champs. Elles sont examinées manuellement par des ingénieurs formés pour identifier les défauts. Les images d'une seule tour génèrent des GB de données, leur analyse prend des jours et elles sont sujettes à des erreurs.
Avec des ressources minimales - un outil de versionnement de données open-source, un GPU, un stockage de données, une infrastructure de service et des ordinateurs portables - l'équipe DS a réalisé un POC initial. Elle a ensuite dû évaluer les avantages de l'utilisation de CV pour les équipes de révision dans le cadre d'un projet pilote de trois mois avec de nouveaux ensembles de données de terrain.
De 1 mois à 1 semaine pour itérer sur un modèle.
+33% du temps passé par les data scientists sur des tâches à forte valeur ajoutée.
De 100 % à 50 % des images examinées manuellement. Seulement 30 % de faux positifs.
Datalake : un datalake centralisé pour indexer, rechercher et stocker toutes les données et suivre les sources et les métadonnées.
Système de suivi : un modèle et un système de suivi des données pour évaluer la qualité et les performances.
Formation continue : une interface dédiée permet aux experts d'examiner les prédictions et aux images examinées de mettre automatiquement à jour de nouveaux ensembles de données de formation.
Formation continue : une interface dédiée permet aux experts d'examiner les prédictions et aux images examinées de mettre automatiquement à jour de nouveaux ensembles de données de formation.