optimisation — 2 contenus
Articles
Quantization INT8 pour l'ASR embarqué : ce que ça coûte vraiment
Analyse des compromis réels de la quantification INT8 sur des modèles de reconnaissance vocale embarqués, avec mesures sur matériel frugal.
Cheat Notes
ONNX & ONNX Runtime en 1 page
Format d'échange interopérable pour modèles de deep learning, avec runtime optimisé multi-cible.