Je vais extraire, nettoyer et organiser les données web
Analyste en recherche de données, automatisation Google Apps Script et Python
À propos de ce service
Je propose des services précis de web scraping, d’extraction, de nettoyage et de mise en forme de données pour des ensembles de données d’entreprises, financières, de fonds, de sociétés et de recherche.
Je peux collecter des données accessibles au public provenant de sites web, de dépôts SEC, d’annuaires, de PDFs, de rapports et d’autres sources en ligne, puis les organiser dans un fichier Excel ou Google Sheets propre. Mon travail inclut l’extraction des champs nécessaires, la suppression des doublons, la validation des enregistrements, la mise en forme des colonnes et la préparation de résultats structurés pour CRM, Salesforce, la recherche ou la génération de rapports.
J’ai réalisé des projets où seules les noms de fonds étaient fournis, et j’ai extrait des informations détaillées au niveau du fonds telles que la structure du produit, le type de fonds, la géographie, l’industrie, le secteur, la classe d’actifs, le style d’investissement, les descriptions, les dates de création, la vintage, l’AUM, la taille cible et le montant clôturé en utilisant les dépôts SEC, des sources publiques et des workflows de recherche assistés par IA.
J’ai également de l’expérience dans la recherche et l’extraction de données d’entreprises et financières à partir de 10-K, 10-Q, 8-K, de rapports publics, de sites web d’entreprises et de documents pour investisseurs.
Je me concentre sur des données propres, fiables et prêtes à l’emploi. Je ne travaille qu’avec des données accessibles au public et je ne contourne pas les pages de connexion, les paywalls ou les sites restreints.
Technologie:
Python
•
Google Sheets
•
Excel
•
vba
•
Apollo
Technique:
Automatisé(e)
Mon portfolio
FAQ
Traduction automatique
Quel type de données pouvez-vous extraire ou scraper ?
Je peux extraire des données accessibles publiquement depuis des sites web, des annuaires, des dépôts SEC, des PDFs, des rapports, des tableaux et des documents en ligne. Je peux organiser ces données dans Excel ou Google Sheets selon les champs requis.
Pouvez-vous extraire des données de plusieurs sites ou sources ?
Oui, je peux collecter des données provenant de plusieurs sources publiques si nécessaire. Le prix dépend de la taille, de la complexité, du nombre de champs et du nettoyage/validation requis.
Pouvez-vous nettoyer et formater les données scrappées ?
Oui. Je peux nettoyer, formater, supprimer les doublons, standardiser les colonnes, valider les enregistrements et préparer le fichier final dans un format structuré Excel ou Google Sheets.
Pouvez-vous extraire des données à partir de dépôts SEC ou de documents financiers ?
Oui. J'ai de l'expérience dans l'extraction de données structurées relatives aux fonds, aux sociétés et aux investissements à partir de dépôts SEC, de sites web, de PDFs et de rapports publics.
Extraisez-vous des sites privés ou restreints ?
Oui, je peux aider avec des extractions complexes où l'information est accessible publiquement mais difficile à collecter automatiquement. Si l'automatisation est limitée, je peux utiliser la recherche manuelle, des workflows assistés par IA et des sources publiques alternatives pour compléter l'ensemble de données. Je ne contourne pas les logins, paywalls ou captchas.
Pouvez-vous fournir des données prêtes pour CRM ou Salesforce ?
Oui. Je peux structurer la sortie selon vos champs CRM ou Salesforce, y compris le formatage des colonnes, les valeurs de type liste déroulante, les descriptions et les notes de validation si nécessaire.
Que se passe-t-il si le site Web bloque le scraping ?
Si le site bloque le scraping ou nécessite une connexion, je vous en informerai avant de continuer et je proposerai des alternatives utilisant des sources accessibles publiquement.

