Je vais construire des solutions OCR et vision par ordinateur avec Python et OpenCV

Harshal D

Certaines informations ont été traduites automatiquement.

build ocr and computer vision solutions with python and opencv

Plein écran

À propos de ce service

Traduction automatique

Vous avez besoin d'OCR, de classification d'images, de détection d'objets ou d'une pipeline de vision par ordinateur sur mesure ? Je crée des systèmes CV de qualité production qui fonctionnent réellement en dehors d'un notebook Jupyter.

CE QUE J'AI ENVOYÉ :

OCR de documents (factures, reçus, formulaires, texte manuscrit)

Classification d'images avec des CNN personnalisés

Détection et suivi d'objets (YOLO, detectron)

Pipeline multimodal (OCR + NLP + post-traitement LLM)

OCR en langues indiennes (Hindi, Marathi, scripts Indic)

Déploiement en production avec Docker et API REST

CE QUE VOUS OBTENEZ :

- Code Python propre et documenté que vous possédez

- Prétraitement adapté à la qualité de vos images

- Validation de précision sur vos données réelles

- Conteneur Docker prêt à déployer (Premium)

- Points d'accès API REST (Standard et Premium)

TECH STACK :

OpenCV, Tesseract, EasyOCR, PaddleOCR

TensorFlow, PyTorch, Keras

YOLO, Detectron2, CNN personnalisés

FastAPI, Flask, Docker

MON PARCOURS CV :

- Déploiement de la pipeline vidéo Whisper + OCR chez Sambhav AI (50 % plus rapide, déployé sur Kubernetes)

- Publication de recherches CNN dans IJCNIS (classificateur de cancer de la peau, TPR > 80 %)

- Modèle de prédiction du cancer du sein (97 % de précision sur plus de 10 000 enregistrements)

- Création d'un parseur de factures POS basé sur OCR (ISKCON, ShopMind)

- GitHub : github.com/harshaldonarkar

Contactez-moi

Moteur d'IA
- tensorflow
- PyTorch
- YOLO
Langage de programmation
- Python
- R
- PyTorch
- Tensorflow
- keras

Découvrez Harshal D

Harshal D

AI Engineer: RAG Pipelines and LLM Integration Expert

DeInde
Membre depuisavr. 2022
Langues
Hindi, Marathi, Anglais

AI Engineer with 2 published research papers (IJCNIS, IRJET) and production deployments. Previously at Sambhav AI where I built Whisper+OCR pipelines and multimodal AI — delivered 50% performance gains. I specialize in RAG systems with LangChain, LLM integration (GPT-4, Claude, Gemini), computer vision with OpenCV, OCR pipelines, and production ML deployment with Docker. I ship working code, not prototypes. Portfolio: harshaldonarkar.github.io | GitHub: harshaldonarkar

Traduction automatique

Mon portfolio

Autres services de Développement IA I Offre

Sites web IA & Logiciel
À partir de 75 $US

FAQ

Traduction automatique

Quelle qualité d'image dois-je fournir ?

Je recommande le prétraitement ; la plupart des images du monde réel (photos de téléphone, scans, captures d'écran) fonctionnent avec le bon pipeline. Partagez des échantillons et je vous dirai à l'avance.

Pouvez-vous traiter du texte manuscrit ?

Oui — EasyOCR ou réglages fins personnalisés selon le volume et le style d'écriture. Partagez des échantillons pour une estimation de précision.

Qu'en est-il de l'OCR pour les langues indiennes ?

Oui — Hindi, Marathi et autres scripts Indic sont supportés. Disponible en tant que fonctionnalité Premium ou en option payante sur Basic/Standard.

Pouvez-vous combiner OCR avec un post-traitement LLM ?

Absolument — c'est l'une de mes forces. Extraction du texte → compréhension du contexte → structuration du résultat. Idéal pour factures, formulaires et documents non structurés.

Déployez-vous le modèle ou livrez-vous seulement le code ?

Les versions Basic et Standard livrent le code + API REST. La version Premium inclut le déploiement Docker, prêt à fonctionner sur votre serveur ou cloud.

Pouvez-vous entraîner un modèle personnalisé pour mon dataset ?

Oui — l'entraînement de CNN personnalisé est inclus dans la version Premium ou disponible en option. J'aurai besoin de données d'entraînement étiquetées de votre part.

À quelle précision puis-je m'attendre ?

Dépend fortement de vos données. Pour l'OCR de texte imprimé propre, plus de 95 % est typique. Pour des images manuscrites ou dégradées, nous validons d'abord sur des échantillons.

Gérez-vous le traitement vidéo en temps réel ?

Oui — la détection et le suivi d'objets sur flux vidéo sont disponibles en option payante. Je suis heureux de discuter des exigences de fréquence d'images et de latence.

Besoin d'activer votre créativité ?

Vous cherchez un expert en technologie ?

Prêt à atteindre et convertir les consommateurs ?

Vous cherchez des rédacteurs ?

Faites fonctionner votre entreprise plus intelligemment

Je vais construire des solutions OCR et vision par ordinateur avec Python et OpenCV

À propos de ce service

Découvrez Harshal D

Mon portfolio

Autres services de Développement IA I Offre

FAQ

Balises associées