Je vais construire des solutions OCR et vision par ordinateur avec Python et OpenCV


À propos de ce service
Traduction automatique
Vous avez besoin d'OCR, de classification d'images, de détection d'objets ou d'une pipeline de vision par ordinateur sur mesure ? Je crée des systèmes CV de qualité production qui fonctionnent réellement en dehors d'un notebook Jupyter.
CE QUE J'AI ENVOYÉ :
OCR de documents (factures, reçus, formulaires, texte manuscrit)
Classification d'images avec des CNN personnalisés
Détection et suivi d'objets (YOLO, detectron)
Pipeline multimodal (OCR + NLP + post-traitement LLM)
OCR en langues indiennes (Hindi, Marathi, scripts Indic)
Déploiement en production avec Docker et API REST
CE QUE VOUS OBTENEZ :
- Code Python propre et documenté que vous possédez
- Prétraitement adapté à la qualité de vos images
- Validation de précision sur vos données réelles
- Conteneur Docker prêt à déployer (Premium)
- Points d'accès API REST (Standard et Premium)
TECH STACK :
OpenCV, Tesseract, EasyOCR, PaddleOCR
TensorFlow, PyTorch, Keras
YOLO, Detectron2, CNN personnalisés
FastAPI, Flask, Docker
MON PARCOURS CV :
- Déploiement de la pipeline vidéo Whisper + OCR chez Sambhav AI (50 % plus rapide, déployé sur Kubernetes)
- Publication de recherches CNN dans IJCNIS (classificateur de cancer de la peau, TPR > 80 %)
- Modèle de prédiction du cancer du sein (97 % de précision sur plus de 10 000 enregistrements)
- Création d'un parseur de factures POS basé sur OCR (ISKCON, ShopMind)
- GitHub : github.com/harshaldonarkar
Contactez-moi
Découvrez Harshal D
AI Engineer: RAG Pipelines and LLM Integration Expert
- DeInde
- Membre depuisavr. 2022
Langues
Hindi, Marathi, Anglais
Traduction automatique
Mon portfolio
Autres services de Développement IA I Offre
FAQ
Traduction automatique
Quelle qualité d'image dois-je fournir ?
Je recommande le prétraitement ; la plupart des images du monde réel (photos de téléphone, scans, captures d'écran) fonctionnent avec le bon pipeline. Partagez des échantillons et je vous dirai à l'avance.
Pouvez-vous traiter du texte manuscrit ?
Oui — EasyOCR ou réglages fins personnalisés selon le volume et le style d'écriture. Partagez des échantillons pour une estimation de précision.
Qu'en est-il de l'OCR pour les langues indiennes ?
Oui — Hindi, Marathi et autres scripts Indic sont supportés. Disponible en tant que fonctionnalité Premium ou en option payante sur Basic/Standard.
Pouvez-vous combiner OCR avec un post-traitement LLM ?
Absolument — c'est l'une de mes forces. Extraction du texte → compréhension du contexte → structuration du résultat. Idéal pour factures, formulaires et documents non structurés.
Déployez-vous le modèle ou livrez-vous seulement le code ?
Les versions Basic et Standard livrent le code + API REST. La version Premium inclut le déploiement Docker, prêt à fonctionner sur votre serveur ou cloud.
Pouvez-vous entraîner un modèle personnalisé pour mon dataset ?
Oui — l'entraînement de CNN personnalisé est inclus dans la version Premium ou disponible en option. J'aurai besoin de données d'entraînement étiquetées de votre part.
À quelle précision puis-je m'attendre ?
Dépend fortement de vos données. Pour l'OCR de texte imprimé propre, plus de 95 % est typique. Pour des images manuscrites ou dégradées, nous validons d'abord sur des échantillons.
Gérez-vous le traitement vidéo en temps réel ?
Oui — la détection et le suivi d'objets sur flux vidéo sont disponibles en option payante. Je suis heureux de discuter des exigences de fréquence d'images et de latence.

