Je ferai un système de reconnaissance vocale
À propos de ce service
La reconnaissance vocale, également connue sous le nom de reconnaissance automatique de la parole (ASR), de reconnaissance vocale informatique ou de synthèse vocale, est une capacité qui permet à un programme de traiter la parole humaine dans un format écrit. Bien qu'elle soit souvent confondue avec la reconnaissance vocale, la reconnaissance vocale se concentre sur la traduction de la parole d'un format verbal à un format textuel, tandis que la reconnaissance vocale cherche simplement à identifier la voix d'un utilisateur individuel.
Je peux intégrer OpenAI Whisper ou Nvidia NeMo. J'ai de l'expérience avec cette bibliothèque. En plus de cela, je peux utiliser la bibliothèque dont vous avez besoin.
Expertise:
Intégration API
•
Classification
•
Extraction des données
Technologie:
Python
