Scraping pour tous ? Pas si vite
Après des années passées à verrouiller son site contre toute tentative d’extraction de données, Leboncoin a surpris son monde en lançant une application basée sur ChatGPT. L’initiative promet de révolutionner la recherche d’annonces, mais interroge sur la cohérence de la stratégie : l’entreprise française vient-elle de fragiliser ses propres remparts anti-scraping ?
Le lancement officiel a eu lieu le 9 février 2026 : Leboncoin vient d’intégrer ses données directement dans ChatGPT via une connexion officielle.
Une nouveauté qui permet à l’IA d’OpenAI d’explorer les quelque 89 millions d’annonces pour répondre en langage naturel aux recherches des utilisateurs.
Sauf que ce choix interpelle. Depuis plus de dix ans, Leboncoin déploie d’innombrables mesures techniques pour contrer les bots et scripts extrayant massivement ses données (blocages d’IP suspectes, CAPTCHA, limitations de taux de requêtes, outils de détection d’automatisation), afin de protéger sa base contre les abus.
Une traque qui s’est aussi étendue au terrain juridique : Leboncoin a mené plusieurs batailles en justice pour protéger ses données, en dénonçant le parasitisme économique et les abus sur sa base d’annonces.
Aujourd’hui, le risque de scraping massif des données de l’immense marketplace française pourrait-il être remis en cause par cette nouvelle application ? C’est le danger pointé du doigt par Anis Ayari, spécialiste français de l’intelligence artificielle.
Nous avons décidé de tester l’expérience nous-mêmes en demandant à l’application d’extraire d’immenses volumes de données.
Dans les faits, si les résultats peuvent sembler impressionnants, on se heurte rapidement aux limites de sécurité imposées par l’application : elle ne liste pas tout.

Réponse de l’application lorsque nous avons demandé de lister toutes les voitures à moins de 10 000 euros disponibles à la vente dans le Val D’Oise // Source : Capture d’écran Numerama La réelle nouveauté réside principalement dans la possibilité d’extraire rapidement des données sous forme de texte ou de tableaux ordonnés, permettant de faire des recherches bien plus complexes et des benchmarks.
Une fonctionnalité qui, jusqu’ici, était réservée aux personnes disposant d’un minimum de bagage technique.
Leboncoin rejette toute possibilité de scraping de masse
Contacté à ce sujet, Leboncoin qualifie d’« infondées » les affirmations selon lesquelles son application sur ChatGPT pourrait être transformée en « super dump SQL ».
L’entreprise française précise que l’application s’appuie strictement sur la même API de recherche que le site Leboncoin : « Elle n’offre aucun accès supplémentaire et applique même davantage de restrictions que le site web classique. »
Une API privée, inaccessible en dehors de ChatGPT ou directement via le site après authentification.
Si risque il doit y avoir, et l’entreprise le concède, il viendrait plutôt de la soumission de requêtes massives qui pourraient faire planter l’API. Mais ce risque DDoS est atténué par le fait que les appels ne sont pas instantanés : chaque nouvelle requête impose un court temps d’attente avant le résultat.
merci à Numerama
