GaiaSense Vision - Système IA Hybride

Le Projet

GaiaSense Vision est un système IA hybride end-to-end développé dans le cadre de ma formation Alyra. Il combine deux approches complémentaires :

Deep Learning (SSD MobileNet V2) pour la détection d'objets dans les images
Machine Learning classique (CatBoost) pour l'analyse de données tabulaires

L'objectif : détecter automatiquement des champignons sains ou contaminés, avec classification des substrats pour l'agriculture.

Architecture Hybride

Modèle Vision (Deep Learning)

SSD MobileNet V2 - Single Shot Detector optimisé pour la production. Détection d'objets en une seule passe, léger (~23MB) et rapide (~150ms par image).

Modèle Tabulaire (ML)

CatBoost - Algorithme de gradient boosting qui gère naturellement les variables catégorielles. Robuste et peu de preprocessing requis.

API REST

FastAPI avec documentation Swagger automatique, système de versioning des modèles, validation des inputs et logging des prédictions.

Interface Web

Flask avec design responsive, upload d'images en temps réel, visualisation des résultats et informations techniques.

Choix Techniques

Chaque choix technologique a été justifié par les contraintes de production :

SSD MobileNet V2 plutôt que YOLO : plus stable, optimisé mobile, meilleur compromis performance/vitesse
CatBoost plutôt que RandomForest ou XGBoost : gère mieux les catégorielles, plus stable, moins de preprocessing
Architecture hybride : exploite le meilleur des deux mondes (DL + ML), modulaire, chaque modèle peut évoluer indépendamment

Stack Technique

Deep Learning

TensorFlow 2.x
SSD MobileNet V2
TensorBoard
Transfer Learning

Machine Learning

CatBoost
Scikit-learn
Joblib
Cross-validation

Backend

FastAPI
Flask
SQLite
Swagger

Outils

Python
Model Versioning
Data Augmentation
Metrics (sklearn)

Performances

60% F1-Score Vision

85% Accuracy ML

~150ms Inférence Vision

~50ms Inférence ML

Fonctionnalités Clés

Versioning Automatique

Système de gestion des versions de modèles avec sauvegarde, chargement du dernier modèle et rollback possible.

Documentation API

Documentation Swagger générée automatiquement, endpoints clairs pour l'intégration avec d'autres systèmes.

Interface Intuitive

Upload d'images simple, visualisation des bounding boxes et scores de confiance, résultats en temps réel.

Monitoring

Logging des prédictions, suivi de l'entraînement via TensorBoard, métriques de performance.

Compétences Développées

Ce projet de 3 mois m'a permis de maîtriser :

Deep Learning : entraînement de modèles de détection avec TensorFlow, transfer learning, data augmentation
Machine Learning : gradient boosting avec CatBoost, validation croisée, feature engineering
Architecture logicielle : conception d'un système hybride modulaire et évolutif
API REST : développement avec FastAPI, documentation automatique, gestion d'erreurs
Déploiement : versioning de modèles, mise en production, bonnes pratiques