Publié le 14 mai 2024
L'inférence d'IA côté client se produit sur l'appareil, ce qui peut être incroyablement puissant en plus de toute configuration côté serveur existante. L'IA intégrée est une forme d'IA côté client qui apporte des modèles au navigateur, protégeant les données sensibles et améliorant la latence.
- Confidentialité et sécurité: l'IA côté client vous permet de travailler avec des données localement, ce qui a un impact important sur votre capacité à travailler avec des données sensibles et à les protéger en termes de confidentialité et de sécurité. Vous pouvez proposer des fonctionnalités d'IA aux utilisateurs avec le chiffrement de bout en bout.
- Disponibilité accrue: l'IA côté client peut vous aider à améliorer la disponibilité de votre application auprès de vos utilisateurs. Les appareils de vos utilisateurs peuvent prendre en charge une partie de la charge de traitement en échange d'un accès plus important aux fonctionnalités d'IA. Si votre produit propose un service premium, vous pouvez envisager de proposer un niveau sans frais avec des fonctionnalités d'IA côté client pour aider vos clients à découvrir ce que le service premium propose.
L'exécution de l'IA côté client ne peut pas remplacer et reproduire complètement le travail que vous effectuez dans le cloud. Après tout, les serveurs sont incroyablement puissants et peuvent héberger des modèles volumineux et complexes qui fournissent des résultats rapides.
Le côté client n'est pas toujours le bon choix. Avant d'aller plus loin, nous souhaitons vous rappeler quelques bonnes pratiques:
- Concevez vos fonctionnalités avec des solutions de secours appropriées et exécutez des benchmarks sur vos appareils cibles. Tous les appareils ne pourront pas servir de plates-formes d'IA.
- Créez des applications pour des cas d'utilisation spécifiques. L'IA côté client est plus adaptée à des cas d'utilisation spécifiques. Les modèles sont intrinsèquement plus petits que ce que l'on trouve généralement dans l'IA côté serveur. Divisez votre processus en étapes ciblées et utilisez le pré- et post-traitement afin que les modèles plus petits puissent toujours fournir la meilleure réponse possible.
- Soyez stratégique concernant les exigences de téléchargement. Les modèles d'IA peuvent être volumineux, ce qui peut entraîner une forte utilisation des données mobiles et de l'espace de stockage de l'appareil. Assurez-vous de créer une fonctionnalité utile pour vos utilisateurs et d'avoir une stratégie de diffusion et de mise en cache responsable.
Envoyer des commentaires
Nous souhaitons connaître les cas d'utilisation qui vous intéressent le plus et obtenir votre avis sur notre approche. Vous pouvez envoyer des commentaires et demander à participer au programme Preview anticipé pour tester avec des prototypes locaux.
Votre contribution peut nous aider à faire de l'IA un outil puissant, mais pratique, pour tous.