Je créerai des jeux de données de formation de haute qualité à partir de vos documents pour le fine-tuning de llm

Certaines informations ont été traduites automatiquement.

Bulgarie

Je parle Anglais, Bulgare

Spécialiste en données d'entraînement AI, création de jeux pour le fine-tuning

Fondateur d'UMELLE, une société de logiciels sur mesure pour les secteurs de l'assurance et de la finance. Je conçois des systèmes d'intelligence documentaire alimentés par l'IA et crée des jeux de do...
À propos de ce service

Contactez-moi avant de passer commande pour que je puisse confirmer que vos documents correspondent au package choisi.


Je crée des jeux de données d’entraînement multi-angle à partir de vos documents d'entreprise, afin d'apprendre aux LLMs à réellement raisonner sur votre domaine.


COMMENT ÇA FONCTIONNE :

Envoyez-moi vos PDFs, documents Word ou manuels de politique. Je génère des paires par segment de document selon trois angles de raisonnement :


Factual : « Quels types de dommages d’eau sont exclus selon la section 4 ? »

Conditionnel : « Si un ordinateur portable est volé lors de son utilisation pour du travail indépendant, est-il couvert ? »

Exclusion : « Qu’est-ce qui n’est PAS couvert lorsque le chiffre d’affaires annuel dépasse 50 000 $ ? »


Chaque paire est vérifiée par rapport au texte source, puis je la relis pour en assurer la précision avant livraison.


CE QUE VOUS RECEVEZ :

- Fichier JSONL au format Alpaca prêt pour toute pipeline de fine-tuning (Unsloth, LLaMA Factory, OpenAI, etc.)

- Paires multi-angle (factual, conditionnel et exclusion)

- Paires de synthèse inter-documents reliant des connaissances entre fichiers liés

- 2 à 3 fois plus de paires par segment que les concurrents à question unique


MEILLEUR POUR :

Assurance, juridique, conformité, documentation produit, entreprise


Obtenez le modèle complet : https://www.Fiverr.com/s/Ld5qPg4

Langage de programmation:

Python

Cadres et outils de modèles d'IA:

Transformateurs Hugging Face

Type de données:

Texte

Moteur d'IA:

GPT

DeepSeek

LLaMa

Langchain

PyTorch