Je vais créer des applications desktop d'IA privées sur appareil


Level 2
À propos de ce service
Traduction automatique
Vos clients ne veulent pas que vous envoyiez leurs données à ChatGPT. Je comprends. Je vais vous créer une application desktop Windows qui exécute un vrai LLM Phi-3, Llama 3, Mistral, Qwen ou Gemma entièrement sur la machine de l'utilisateur
Pas de cloud. Pas de clés API. Pas de fuite de données. Pas de factures récurrentes OpenAI. Pas de soucis avec le RGPD. Pas de préoccupations HIPAA.
Je suis un développeur senior Windows (plus de 13 ans) travaillant actuellement sur des outils de débogage matériel dans une entreprise mondiale de silicium. Je maîtrise ONNX Runtime, DirectML, l'accélération GPU/NPU, et comment déployer un modèle de 24 Go dans un installateur MSIX ou Inno Setup sans le casser.
Idéal pour :
- Cabinets d'avocats traitant des données clients confidentielles
- Fournisseurs de soins de santé (HIPAA)
- Conseillers financiers et comptables
- Défense et sous-traitants gouvernementaux (ITAR, CMMC)
- Outils RH avec PII des employés
- Toute équipe soumise à GDPR, SOC 2 ou règles internes de résidence des données
- Entreprises dans des régions avec une mauvaise connectivité Internet
Pile technologique : C# / WPF / WinUI, ONNX Runtime GenAI, llama.cpp, Microsoft.ML.OnnxRuntime, DirectML, Semantic Kernel (mode local), LiteDB pour le stockage vectoriel, packaging MSIX / Inno Setup
Exigences matérielles auxquelles je vous aiderai à planifier : je recommanderai des spécifications minimales pour vos utilisateurs finaux en fonction de la taille du modèle
Découvrez Shashank
Windows Desktop Developer C Sharp, C plus plus , Python , WPF, XAML, AI
Level 2
- DeInde
- Membre depuisjanv. 2018
- Temps de réponse moy.1 heure
- Dernière commande4 semaines
Langues
Anglais, Allemand, Portugais, Français
Traduction automatique
Mon portfolio
FAQ
Traduction automatique
Les modèles locaux sont-ils aussi performants que GPT-4 ?
Honnêtement, pas aussi bons dans tous les domaines — mais étonnamment proches pour de nombreuses tâches. Phi-3-mini et Llama 3 8B gèrent très bien les questions-réponses, la synthèse, l'extraction et la rédaction. Pour des tâches nécessitant une connaissance approfondie du monde ou un raisonnement complexe, les modèles cloud restent en tête.
Quelle est la taille de l'installateur final ?
Entre 2 Go et 8 Go selon le modèle. J'utilise des installateurs qui téléchargent le modèle lors du premier lancement si vous préférez une petite taille de téléchargement initiale.
Cela fonctionnera-t-il sur un ordinateur portable de 5 ans ?
Oui, avec un modèle plus petit (Phi-3-mini, 3,8 milliards de paramètres) sur CPU — plus lent, peut-être 3 à 6 tokens par seconde. Pour des réponses en temps réel, 16 Go de RAM et un CPU moderne sont recommandés.
Peut-il utiliser le NPU sur les nouveaux PC Copilot+ ?
Oui. ONNX Runtime avec DirectML peut cibler le NPU sur Qualcomm Snapdragon X et les NPU Intel / AMD plus récents pour une inférence beaucoup plus rapide avec une consommation d'énergie réduite.
Et si je veux mettre à jour le modèle plus tard ?
Les packages Standard et Premium incluent un mécanisme de remplacement de modèle pour que vous (ou vos utilisateurs) puissiez insérer un modèle plus récent ou différent sans avoir besoin d'un nouvel installateur.
Vous gérez le fine-tuning ?
Le fine-tuning est une démarche distincte. Pour la plupart des cas d'usage, RAG (récupération à partir de vos propres documents) donne le même résultat pratique sans le coût et la complexité du fine-tuning. Je vous conseillerai honnêtement sur ce dont vous avez besoin.
Pouvez-vous signer un BAA HIPAA ?
Je ne signe pas de BAAs en tant que freelance solo, mais votre application peut être conforme HIPAA par conception — c'est exactement ce que je construis. Je vous expliquerai la différence lors de notre premier échange.
Qu'en est-il de la licence commerciale des modèles ?
Je n'utilise que des modèles avec des licences permissives (Phi-3 MIT, Llama 3 avec la licence commerciale de Meta, Mistral Apache 2.0, Qwen). Je vous informerai des implications de licence avant de finaliser le choix du modèle.

