Le Projet
GaiaSense Vision est un système IA hybride end-to-end développé dans le cadre de ma formation Alyra. Il combine deux approches complémentaires :
- Deep Learning (SSD MobileNet V2) pour la détection d'objets dans les images
- Machine Learning classique (CatBoost) pour l'analyse de données tabulaires
L'objectif : détecter automatiquement des champignons sains ou contaminés, avec classification des substrats pour l'agriculture.
Architecture Hybride
Modèle Vision (Deep Learning)
SSD MobileNet V2 - Single Shot Detector optimisé pour la production. Détection d'objets en une seule passe, léger (~23MB) et rapide (~150ms par image).
Modèle Tabulaire (ML)
CatBoost - Algorithme de gradient boosting qui gère naturellement les variables catégorielles. Robuste et peu de preprocessing requis.
API REST
FastAPI avec documentation Swagger automatique, système de versioning des modèles, validation des inputs et logging des prédictions.
Interface Web
Flask avec design responsive, upload d'images en temps réel, visualisation des résultats et informations techniques.
Choix Techniques
Chaque choix technologique a été justifié par les contraintes de production :
- SSD MobileNet V2 plutôt que YOLO : plus stable, optimisé mobile, meilleur compromis performance/vitesse
- CatBoost plutôt que RandomForest ou XGBoost : gère mieux les catégorielles, plus stable, moins de preprocessing
- Architecture hybride : exploite le meilleur des deux mondes (DL + ML), modulaire, chaque modèle peut évoluer indépendamment
Stack Technique
Deep Learning
- TensorFlow 2.x
- SSD MobileNet V2
- TensorBoard
- Transfer Learning
Machine Learning
- CatBoost
- Scikit-learn
- Joblib
- Cross-validation
Backend
- FastAPI
- Flask
- SQLite
- Swagger
Outils
- Python
- Model Versioning
- Data Augmentation
- Metrics (sklearn)
Performances
Fonctionnalités Clés
Versioning Automatique
Système de gestion des versions de modèles avec sauvegarde, chargement du dernier modèle et rollback possible.
Documentation API
Documentation Swagger générée automatiquement, endpoints clairs pour l'intégration avec d'autres systèmes.
Interface Intuitive
Upload d'images simple, visualisation des bounding boxes et scores de confiance, résultats en temps réel.
Monitoring
Logging des prédictions, suivi de l'entraînement via TensorBoard, métriques de performance.
Compétences Développées
Ce projet de 3 mois m'a permis de maîtriser :
- Deep Learning : entraînement de modèles de détection avec TensorFlow, transfer learning, data augmentation
- Machine Learning : gradient boosting avec CatBoost, validation croisée, feature engineering
- Architecture logicielle : conception d'un système hybride modulaire et évolutif
- API REST : développement avec FastAPI, documentation automatique, gestion d'erreurs
- Déploiement : versioning de modèles, mise en production, bonnes pratiques
Un projet IA ?
Deep Learning, Machine Learning, Computer Vision... Discutons de votre cas d'usage.