Projet Alyra
IA / Deep Learning

GaiaSense Vision

Système IA hybride end-to-end pour la détection automatique

Année 2025
Durée 3 mois
Contexte Formation Alyra
GaiaSense Vision - Système IA hybride

Le Projet

GaiaSense Vision est un système IA hybride end-to-end développé dans le cadre de ma formation Alyra. Il combine deux approches complémentaires :

  • Deep Learning (SSD MobileNet V2) pour la détection d'objets dans les images
  • Machine Learning classique (CatBoost) pour l'analyse de données tabulaires

L'objectif : détecter automatiquement des champignons sains ou contaminés, avec classification des substrats pour l'agriculture.

Architecture Hybride

Modèle Vision (Deep Learning)

SSD MobileNet V2 - Single Shot Detector optimisé pour la production. Détection d'objets en une seule passe, léger (~23MB) et rapide (~150ms par image).

Modèle Tabulaire (ML)

CatBoost - Algorithme de gradient boosting qui gère naturellement les variables catégorielles. Robuste et peu de preprocessing requis.

API REST

FastAPI avec documentation Swagger automatique, système de versioning des modèles, validation des inputs et logging des prédictions.

Interface Web

Flask avec design responsive, upload d'images en temps réel, visualisation des résultats et informations techniques.

Choix Techniques

Chaque choix technologique a été justifié par les contraintes de production :

  • SSD MobileNet V2 plutôt que YOLO : plus stable, optimisé mobile, meilleur compromis performance/vitesse
  • CatBoost plutôt que RandomForest ou XGBoost : gère mieux les catégorielles, plus stable, moins de preprocessing
  • Architecture hybride : exploite le meilleur des deux mondes (DL + ML), modulaire, chaque modèle peut évoluer indépendamment

Stack Technique

Deep Learning

  • TensorFlow 2.x
  • SSD MobileNet V2
  • TensorBoard
  • Transfer Learning

Machine Learning

  • CatBoost
  • Scikit-learn
  • Joblib
  • Cross-validation

Backend

  • FastAPI
  • Flask
  • SQLite
  • Swagger

Outils

  • Python
  • Model Versioning
  • Data Augmentation
  • Metrics (sklearn)

Performances

60% F1-Score Vision
85% Accuracy ML
~150ms Inférence Vision
~50ms Inférence ML

Fonctionnalités Clés

Versioning Automatique

Système de gestion des versions de modèles avec sauvegarde, chargement du dernier modèle et rollback possible.

Documentation API

Documentation Swagger générée automatiquement, endpoints clairs pour l'intégration avec d'autres systèmes.

Interface Intuitive

Upload d'images simple, visualisation des bounding boxes et scores de confiance, résultats en temps réel.

Monitoring

Logging des prédictions, suivi de l'entraînement via TensorBoard, métriques de performance.

Compétences Développées

Ce projet de 3 mois m'a permis de maîtriser :

  • Deep Learning : entraînement de modèles de détection avec TensorFlow, transfer learning, data augmentation
  • Machine Learning : gradient boosting avec CatBoost, validation croisée, feature engineering
  • Architecture logicielle : conception d'un système hybride modulaire et évolutif
  • API REST : développement avec FastAPI, documentation automatique, gestion d'erreurs
  • Déploiement : versioning de modèles, mise en production, bonnes pratiques

Un projet IA ?

Deep Learning, Machine Learning, Computer Vision... Discutons de votre cas d'usage.