Quantization INT8 pour l'ASR embarqué : ce que ça coûte vraiment
Analyse des compromis réels de la quantification INT8 sur des modèles de reconnaissance vocale embarqués, avec mesures sur matériel frugal.
IA frugale pour les terrains à faibles ressources.
Des modèles conçus pour tourner là où les ressources sont rares, au service des communautés sous-représentées et trop souvent laissées pour compte par l'IA mainstream : c'est ce que nous construisons et mesurons.
Analyse des compromis réels de la quantification INT8 sur des modèles de reconnaissance vocale embarqués, avec mesures sur matériel frugal.
Format d'échange interopérable pour modèles de deep learning, avec runtime optimisé multi-cible.
Deux métriques d'évaluation pour la reconnaissance vocale — comment les choisir, les calculer et éviter les pièges.
Comparaison de modèles ASR ouverts sur le sous-ensemble africain de FLEURS (Wolof, Haoussa, Yoruba, Swahili), avec contrainte mémoire < 2 Go RAM et latence < 3 s sur Snapdragon 439.
Application Android de reconnaissance vocale fonctionnant entièrement hors-ligne, optimisée pour les smartphones à 2 Go de RAM et processeurs Snapdragon 439/632.