Je vais extraire et collecter des données de n'importe quel site web avec python, selenium ou playwright

Certaines informations ont été traduites automatiquement.

Pakistan

Je parle Anglais, Ourdou, Hindi

Développeur Python Analyste de données Passionné de ML

Je suis étudiant en génie logiciel spécialisé en développement Python, analyse de données et apprentissage automatique. J’aide les entreprises à nettoyer et organiser leurs données, automatiser les tâ...
À propos de ce service

Transformez n'importe quel site web en données propres et exploitables.

Je crée des scrapers fiables pour des pages statiques simples ainsi que pour des sites modernes riches en JavaScript, ceux que les scrapers classiques ne peuvent pas toucher car le contenu ne se charge qu'après l'exécution des scripts de la page.

Que vous ayez besoin de listes de produits, de prix, de prospects, d'avis, de données immobilières ou toute autre information structurée extraite du web, je mettrai en place une solution automatisée qui vous la livrera dans le format souhaité Excel, CSV, JSON ou directement dans une base de données ou Google Sheet.

Ce avec quoi je travaille :

  • Python (Requests, BeautifulSoup) pour une extraction rapide à partir de sites statiques
  • Selenium et Playwright pour des sites rendus en JavaScript, protégés par login ou interactifs
  • Scrapy pour un crawling à grande échelle et multi-pages
  • Puppeteer pour l'automatisation de navigateur sur des projets Node

Ce que vous obtenez :

  • Données propres et structurées, sans doublons, sans HTML inutile, sans lignes cassées
  • Livraison dans le format de votre choix (CSV / Excel / JSON / Google Sheets)
  • Gestion de la pagination, du défilement infini et des murs de login si nécessaire
  • Code source fourni si vous souhaitez relancer le scraper vous-même plus tard
  • Communication claire tout au long du projet, je signalerai toute restriction ou blocage du site dès le début, avant que cela ne pose problème à la livraison

Technologie:

Python

Marionnettiste

scrapy

sélénium

Playwright

Type d'information:

Informations de contact

Listes

Technique:

Automatisé(e)

Mon portfolio