Notre agence créera un jeu de données d'entraînement pour l'IA avec collecte, nettoyage et annotation

Certaines informations ont été traduites automatiquement.
R
rakibj45

Bangladesh

Anglais

132 commandes terminées

Développeur de jeux et d'IA

🎮 Gameloops est une équipe créative de développeurs, d'artistes et de designers qui conçoivent des jeux avec une mentalité axée sur le joueur. 🧠 Nous nous concentrons sur un gameplay engageant, des ...
Certifié par Fiverr Pro

Gameloops a été sélectionné par l'équipe Fiverr Pro pour son expertise.

Certifié pour

  • Développement de jeux

À propos de ce service

La plupart des projets de fine-tuning d'IA échouent avant même le début de l'entraînement. Le jeu de données est incomplet, mal étiqueté ou mal formaté pour le modèle. Je gère l'ensemble du pipeline de données, de la collecte brute à la livraison prête pour l'entraînement, pour que vous n'ayez jamais à toucher une feuille de calcul.

J'ai moi-même construit et affiné des LLMs.


Ce que vous obtenez

Collecte de données brutes via web scraping, curation de jeux de données publics ou génération synthétique avec GPT. Nettoyage des données : déduplication, normalisation, suppression d'échantillons de faible qualité et gestion des champs manquants. Annotation professionnelle formatée pour votre tâche précise : classification, NER, paires instruction-réponse ou schéma personnalisé. Validation du jeu de données : vérification de la cohérence des étiquettes, analyse de l'équilibre des classes et division d'évaluation réservée. Fiche complète du jeu de données documentant le schéma, les définitions d'étiquettes, le nombre d'échantillons et les statistiques de couverture. Livraison finale dans le format souhaité : JSONL, CSV, prêt à l'emploi.


Pourquoi travailler avec moi

J'ai géré des pipelines de fine-tuning avec QLoRA et Unsloth. Je sais ce qui fait que les données d'entraînement produisent un modèle bien comporté versus un qui surapprend ou s'effondre. Vous n'embauchez pas un étiqueteur. Vous embauchez quelqu'un qui comprend ce qui se passe après la livraison des données.

Technologie:

Excel

Google Sheets

Microsoft Word

Jupyter Notebook

Industrie:

Art et design

Éducation

Environnement

Type de données:

Numériques

Chaîne

Date

Texte libre

Autre

Portfolio