Je vais construire des agents IA, des bots de web scraping et des pipelines d'extraction de données en python


À propos de ce service
Traduction automatique
Destiné à
- Fondateurs et responsables opérationnels ayant besoin de données récurrentes (suivi des prix, enrichissement de leads, étude de marché)
- Chercheurs et analystes extrayant des données structurées de sites web publics ou de PDFs
- Équipes de ML et d'IA collectant des données d'entraînement
- Agences dont les clients demandent "scrapez ceci pour nous" et qui ont besoin d'un sous-traitant fiable
Ce que je construis
- Web scrapers en Python (Scrapy, BeautifulSoup, Playwright) ou Node (Playwright, Puppeteer)
- Analyse assistée par IA avec OpenAI ou Claude pour transformer des pages non structurées en JSON typé, et non en spaghetti regex
- Pipelines de données récurrents avec planification, déduplication, détection de changements et alertes
- Extraction de PDFs, documents et OCR lorsque les données ne sont pas sur une page web
Stack
Python, JavaScript, TypeScript, Scrapy, BeautifulSoup, Playwright, Puppeteer, Selenium, requests, httpx, Pandas, OpenAI
API, API Anthropic Claude, appel de fonctions et sorties structurées, PostgreSQL, MongoDB, Supabase, Airtable, Google Sheets
Découvrez Hamza Khan
Experienced Full Stack AI Developer
- DePakistan
- Membre depuisfévr. 2020
- Temps de réponse moy.6 heures
- Dernière commande1 an
Langues
Anglais, Hindi, Italien, Français
Traduction automatique
Mon portfolio
Autres services de Développement de logiciels I Offre
FAQ
Traduction automatique
Quelle est la différence entre le scraping classique et l'"extraction assistée par IA" ?
Le scraping classique utilise des sélecteurs CSS/XPath qui cassent dès qu'un site change de mise en page. L'extraction assistée par IA utilise Claude ou GPT pour lire la page comme un humain et renvoyer un JSON structuré selon votre schéma. C'est plus résilient, cela gère les mises en page désordonnées et vous permet d'extraire des champs sémantiques.
Le scraper fonctionnera-t-il toujours après la mise à jour du site web ?
Les extractions assistées par IA sont résistantes à la plupart des changements de mise en page. Les scrapers basés sur des sélecteurs ne le sont pas — si le HTML du site est réécrit, le scraper nécessite une maintenance. La formule Premium inclut 14 jours de corrections gratuites ; après, je propose un contrat de maintenance.
Quels sites pouvez-vous scraper ?
Sites web publics dont les Conditions d'Utilisation permettent l'accès automatisé, ou dont les données sont explicitement publiques (catalogues de produits, annonces immobilières, données gouvernementales, actualités, profils publics sur des sites professionnels avec des politiques de scraping claires, etc.). Lors de l'appel de scope, je passerai en revue votre cible.
