Je vais extraire des données et scraper des sites web en formats propres CSV json yaml
À propos de ce service
Bonjour ! Si vous en avez assez de copier des données depuis des sites ou de vous battre avec des fichiers désordonnés, je suis là pour vous faire gagner du temps.
Je prends en charge ces tâches ennuyeuses et répétitives. Avec Python, j’extrais des données publiques du web, des images ou des documents et je les transforme en fichiers structurés CSV, JSON ou YAML. C’est un processus rapide pour moi, mais une grosse migraine évitée pour vous !
Voici ce que je peux faire :
- Web scraping : annuaires publics, listes de produits et catalogues.
- Parsing de documents : transformer du texte ou des documents désordonnés en données propres.
- Liens d’actifs : rassembler proprement les URLs d’images ou de médias.
- Nettoyage de données : corriger les caractères cassés et organiser la mise en page.
Ce que je ne prends pas en charge (pour rester abordable et rapide) : je travaille uniquement avec des données publiques non protégées. Je ne gère pas les sites avec des systèmes anti-bot lourds (comme CAPTCHAs), les profils nécessitant une connexion ou le développement de logiciels sur mesure.
Discutons d’abord ! Chaque mise en page est un peu différente. Merci de m’envoyer un message avant de commander avec un lien vers le site ou un fichier d’exemple. Une vidéo de 1 minute (comme un clip Loom) est la façon la plus rapide de commencer !
Technologie:
Python
•
sélénium
•
Beautiful Soup
•
Playwright
•
Pandas
Technique:
Automatisé(e)
