De l'adresse mail à la géolocalisation

Une entreprise s’est penchée sur les données récupérées par les chatbot basés sur l’intelligence artificielle. Résultat, toutes les modèles de langage extirpent des données, mais certains sont plus gourmands.
La quasi-totalité des applications vous extirpent des données, et les chatbots basés sur l’intelligence artificielle aussi. L’entreprise de VPN Surfshark s’est penchée sur les pratiques des dix chatbots IA les plus populaires disponibles sur l’App Store, dont Google Gemini, DeepSeek, ChatGPT, Copilot, Poe et Jasper.
Dans un rapport publié le 18 février, la société expose une collecte intensive des données personnelles des utilisateurs : en moyenne, chaque application récupère 11 types d’informations différentes sur un total possible de 35. Certaines vont encore plus loin, à l’image de Google Gemini, qui enregistre 22 catégories de données, incluant des informations personnelles (nom, e-mail, numéro de téléphone), l’historique de navigation, les contacts, et des infos de géolocalisation précises. Voici une liste des applis décortiquées par Surfshark.
Notez que l’entreprise n’avait pas creusé dans l’application du champion français Mistral AI au moment de l’étude.
Les chatbots les plus populaires et le nombre d’infos qu’ils récupèrent :

L’étude souligne également des pratiques de suivi et de recoupement des données pour des usages publicitaires ou analytiques. Environ 40 % des chatbots collectent la localisation des utilisateurs, et 30 % croisent ces données avec des informations tierces. Jasper, par exemple, recueille des identifiants d’appareil, des données d’interaction produit et des informations publicitaires, exposant ainsi les utilisateurs à un suivi intensif.
Quant à DeepSeek, le chatbot conserve 11 types de données, dont l’historique des conversations, sur des serveurs basés en Chine, ce qui pose la question de la sécurité et de la confidentialité des échanges. La plateforme a d’ailleurs subi une fuite de données majeure, exposant plus d’un million d’enregistrements, incluant des historiques de discussions et des clés API sensibles. Face à ces pratiques, les experts appellent à une plus grande vigilance de la part des utilisateurs et à une transparence accrue des entreprises quant à l’exploitation des données collectées.
merci à Numerama