Je vais nettoyer, valider et préparer votre jeu de données pour l'apprentissage automatique

Certaines informations ont été traduites automatiquement.

Vetted Pro

Sri Lanka

Je parle Anglais, Cinghalais

5 commandes terminées

Scraping éthique de sites web et livraison de jeux de données de qualité mondiale

Je suis un grand maître de Kaggle classé numéro 1 mondial pour les jeux de données, titulaire d’un MSc en Data Science de Cardiff Metropolitan University et avec plus de 18 000 heures d’expérience en ...
Certifié par Fiverr Pro

Kanchanak a été sélectionné par l'équipe Fiverr Pro pour son expertise.

Certifié pour

  • Data science et machine learning

À propos de ce service

Vetted Pro

Vous avez du mal avec un jeu de données CSV ou Excel désordonné qui n'est pas prêt pour l'analyse, les tableaux de bord ou l'apprentissage automatique ?


Je vais nettoyer, valider et préparer votre jeu de données pour qu'il devienne structuré, cohérent et prêt pour l'ML.


Je suis Kanchana1, un Grandmaster Kaggle Datasets et vendeur certifié Fiverr. Je me spécialise dans la création de jeux de données de haute qualité, la correction des problèmes de qualité des données et la préparation des données pour des workflows analytiques et d'apprentissage automatique.


Voici ce que je peux faire :


Nettoyage de jeux de données CSV et Excel

Suppression des doublons

Gestion des valeurs manquantes

Correction des noms et formats de colonnes

Correction des types de données

Standardisation des catégories, dates et champs numériques

Identification des valeurs aberrantes et des problèmes de qualité

Préparation des jeux de données pour l'apprentissage automatique

Création de notebooks Python pour le prétraitement

Fourniture d'un rapport clair sur la qualité des données


Vous recevrez un jeu de données final propre, un résumé des problèmes détectés et une explication claire du travail effectué. Les packages Standard et Premium peuvent inclure des notebooks Python et une documentation QA approfondie.


Veuillez me contacter avant de commander si votre jeu de données est volumineux, sensible, complexe ou comporte plus de 50 000 lignes.


Je travaille uniquement avec des données légales, éthiques et autorisées.

Expertise:

Apprentissage des fonctionnalités

Classification

Langage de programmation:

Python

Frameworks:

PyTorch

Panda

Autres

Outils:

Jupyter Notebook

Excel

Colab

Mon portfolio

Autres services de Data science et machine learning I Offre