Je vais enregistrer un ensemble de données de discours pashto ou dari pour l'entraînement de modèles d'IA


À propos de ce service
Traduction automatique
Vous cherchez des enregistrements vocaux propres, natifs en pashto ou persan/dari pour vos projets d'IA, reconnaissance vocale ou NLP ?
Vous êtes au bon endroit !
Je vais enregistrer des énoncés de haute qualité en pashto ou dari avec précision native, parfaits pour entraîner modèles d'IA, systèmes de reconnaissance vocale (STT) et ASR.
Je vous fournirai :
- Audio WAV/MP3 sans bruit
- Accents natifs pashto et persan/dari
- Transcription + étiquetage + métadonnées (CSV/Excel)
- Plusieurs locuteurs disponibles (sur demande)
Que vous ayez besoin d'un petit ensemble de données de départ ou d'un corpus de discours à grande échelle, je peux livrer rapidement, de manière fiable et avec une relecture professionnelle.
Construisons votre ensemble de données pour l'IA avec clarté, précision et confiance !
Découvrez Mansour Sadat
Innovative Frontend Web Developer and Fluent Trilingual Translator
- DeAfghanistan
- Membre depuisjuil. 2024
- Temps de réponse moy.1 heure
Langues
Anglais, Pachto, Persan
Traduction automatique
Mon portfolio
FAQ
Traduction automatique
Que fournissez-vous exactement dans les enregistrements ?
Je fournis des énoncés en pashto ou persan/dari en audio propre et sans bruit (WAV/MP3). Selon votre package, j'inclus également la transcription, l'étiquetage et les métadonnées au format CSV/Excel.
Que sont les métadonnées ?
Les métadonnées sont des informations structurées sur chaque fichier audio (par exemple, nom de fichier, texte de l'énoncé, ID du locuteur, durée). Cela facilite l'organisation et l'utilisation de votre ensemble de données pour des projets d'IA/ML.
Qu’est-ce que la transcription ?
La transcription est la version écrite du contenu audio, utile pour entraîner des modèles de reconnaissance vocale.
Qu'est-ce que l'étiquetage ?
L'étiquetage consiste à marquer l'ensemble de données (par exemple, par locuteur, genre, type d'énoncé ou catégorie) afin que les modèles d'IA puissent reconnaître plus efficacement les motifs.
Puis-je demander plusieurs locuteurs ?
Oui ! Par défaut, j'enregistre avec un locuteur natif, mais vous pouvez commander l'option supplémentaire « Locuteur additionnel » pour plus de voix.
Et si j'ai besoin d'un ensemble de données plus grand (des milliers d'énoncés) ?
Envoyez-moi une commande personnalisée — je peux augmenter la taille et créer un ensemble de données adapté à votre projet avec la participation de nombreux locuteurs natifs.
Dans quels formats livrez-vous ?
L'audio est livré en WAV ou MP3, tandis que le texte/transcription/métadonnées sont fournis en TXT, CSV ou Excel, selon votre préférence.

