Je vais enregistrer un ensemble de données de discours pashto ou dari pour l'entraînement de modèles d'IA

Mansour Sadat

Certaines informations ont été traduites automatiquement.

record pashto or dari speech dataset for ai model training

Voir la présentation

À propos de ce service

Traduction automatique

Vous cherchez des enregistrements vocaux propres, natifs en pashto ou persan/dari pour vos projets d'IA, reconnaissance vocale ou NLP ?

Vous êtes au bon endroit !

Je vais enregistrer des énoncés de haute qualité en pashto ou dari avec précision native, parfaits pour entraîner modèles d'IA, systèmes de reconnaissance vocale (STT) et ASR.

Je vous fournirai :

Audio WAV/MP3 sans bruit
Accents natifs pashto et persan/dari
Transcription + étiquetage + métadonnées (CSV/Excel)
Plusieurs locuteurs disponibles (sur demande)

Que vous ayez besoin d'un petit ensemble de données de départ ou d'un corpus de discours à grande échelle, je peux livrer rapidement, de manière fiable et avec une relecture professionnelle.

Construisons votre ensemble de données pour l'IA avec clarté, précision et confiance !

Langue
- Dari
- Anglais
- Persan / Farsi

Découvrez Mansour Sadat

Mansour Sadat

Innovative Frontend Web Developer and Fluent Trilingual Translator

DeAfghanistan
Membre depuisjuil. 2024
Temps de réponse moy.1 heure
Langues
Anglais, Pachto, Persan

I'm Sayed Mansour Sadat, a Front-End Developer, AI Data Specialist, and Trilingual Language Professional (English, Dari/Farsi, and Pashto) with more than three years of experience. I specialize in AI evaluation, language-related tasks, data annotation, and multilingual workflows while also building clean, responsive websites. I focus on accuracy, clear communication, fast delivery, and delivering reliable results for every project.

Traduction automatique

Mon portfolio

FAQ

Traduction automatique

Que fournissez-vous exactement dans les enregistrements ?

Je fournis des énoncés en pashto ou persan/dari en audio propre et sans bruit (WAV/MP3). Selon votre package, j'inclus également la transcription, l'étiquetage et les métadonnées au format CSV/Excel.

Que sont les métadonnées ?

Les métadonnées sont des informations structurées sur chaque fichier audio (par exemple, nom de fichier, texte de l'énoncé, ID du locuteur, durée). Cela facilite l'organisation et l'utilisation de votre ensemble de données pour des projets d'IA/ML.

Qu’est-ce que la transcription ?

La transcription est la version écrite du contenu audio, utile pour entraîner des modèles de reconnaissance vocale.

Qu'est-ce que l'étiquetage ?

L'étiquetage consiste à marquer l'ensemble de données (par exemple, par locuteur, genre, type d'énoncé ou catégorie) afin que les modèles d'IA puissent reconnaître plus efficacement les motifs.

Puis-je demander plusieurs locuteurs ?

Oui ! Par défaut, j'enregistre avec un locuteur natif, mais vous pouvez commander l'option supplémentaire « Locuteur additionnel » pour plus de voix.

Et si j'ai besoin d'un ensemble de données plus grand (des milliers d'énoncés) ?

Envoyez-moi une commande personnalisée — je peux augmenter la taille et créer un ensemble de données adapté à votre projet avec la participation de nombreux locuteurs natifs.

Dans quels formats livrez-vous ?

L'audio est livré en WAV ou MP3, tandis que le texte/transcription/métadonnées sont fournis en TXT, CSV ou Excel, selon votre préférence.

Besoin d'activer votre créativité ?

Vous cherchez un expert en technologie ?

Prêt à atteindre et convertir les consommateurs ?

Vous cherchez des rédacteurs ?

Faites fonctionner votre entreprise plus intelligemment

Je vais enregistrer un ensemble de données de discours pashto ou dari pour l'entraînement de modèles d'IA

À propos de ce service

Découvrez Mansour Sadat

Mon portfolio

FAQ

Balises associées