Je vais créer des applications desktop d'IA privées sur appareil

Shashank

Level 2

Certaines informations ont été traduites automatiquement.

private, on device ai desktop applications

Plein écran

À propos de ce service

Traduction automatique

Vos clients ne veulent pas que vous envoyiez leurs données à ChatGPT. Je comprends. Je vais vous créer une application desktop Windows qui exécute un vrai LLM Phi-3, Llama 3, Mistral, Qwen ou Gemma entièrement sur la machine de l'utilisateur

Pas de cloud. Pas de clés API. Pas de fuite de données. Pas de factures récurrentes OpenAI. Pas de soucis avec le RGPD. Pas de préoccupations HIPAA.

Je suis un développeur senior Windows (plus de 13 ans) travaillant actuellement sur des outils de débogage matériel dans une entreprise mondiale de silicium. Je maîtrise ONNX Runtime, DirectML, l'accélération GPU/NPU, et comment déployer un modèle de 24 Go dans un installateur MSIX ou Inno Setup sans le casser.

Idéal pour :

Cabinets d'avocats traitant des données clients confidentielles
Fournisseurs de soins de santé (HIPAA)
Conseillers financiers et comptables
Défense et sous-traitants gouvernementaux (ITAR, CMMC)
Outils RH avec PII des employés
Toute équipe soumise à GDPR, SOC 2 ou règles internes de résidence des données
Entreprises dans des régions avec une mauvaise connectivité Internet

Pile technologique : C# / WPF / WinUI, ONNX Runtime GenAI, llama.cpp, Microsoft.ML.OnnxRuntime, DirectML, Semantic Kernel (mode local), LiteDB pour le stockage vectoriel, packaging MSIX / Inno Setup

Exigences matérielles auxquelles je vous aiderai à planifier : je recommanderai des spécifications minimales pour vos utilisateurs finaux en fonction de la taille du modèle

Expertise
- Algorithmes & Structures de données
- Localisation
- Performance
- Sécurité
- Contrôle des sources
Langage de programmation
- C#
- ASP.NET
Framework frontend
- Autres
Framework back-end
- Node.js
- Autres

Découvrez Shashank

Shashank

Windows Desktop Developer C Sharp, C plus plus , Python , WPF, XAML, AI

4,8(77)

Level 2

DeInde
Membre depuisjanv. 2018
Temps de réponse moy.1 heure
Dernière commande3 mois
Langues
Anglais, Allemand, Portugais, Français

Accomplished Software Developer with 14 years of experience by acting as individual contributor mainly towards Windows Desktop Applications and C++ Programming. I'm also an AI integration specialist with 4 years of experience in bringing cutting-edge AI capabilities to applications and websites just like yours. With a focus on creating seamless, intuitive interactions, I've helped numerous clients enhance their digital platforms with AI, improving user engagement and operational efficiency.

Traduction automatique

Mon portfolio

FAQ

Traduction automatique

Les modèles locaux sont-ils aussi performants que GPT-4 ?

Honnêtement, pas aussi bons dans tous les domaines — mais étonnamment proches pour de nombreuses tâches. Phi-3-mini et Llama 3 8B gèrent très bien les questions-réponses, la synthèse, l'extraction et la rédaction. Pour des tâches nécessitant une connaissance approfondie du monde ou un raisonnement complexe, les modèles cloud restent en tête.

Quelle est la taille de l'installateur final ?

Entre 2 Go et 8 Go selon le modèle. J'utilise des installateurs qui téléchargent le modèle lors du premier lancement si vous préférez une petite taille de téléchargement initiale.

Cela fonctionnera-t-il sur un ordinateur portable de 5 ans ?

Oui, avec un modèle plus petit (Phi-3-mini, 3,8 milliards de paramètres) sur CPU — plus lent, peut-être 3 à 6 tokens par seconde. Pour des réponses en temps réel, 16 Go de RAM et un CPU moderne sont recommandés.

Peut-il utiliser le NPU sur les nouveaux PC Copilot+ ?

Oui. ONNX Runtime avec DirectML peut cibler le NPU sur Qualcomm Snapdragon X et les NPU Intel / AMD plus récents pour une inférence beaucoup plus rapide avec une consommation d'énergie réduite.

Et si je veux mettre à jour le modèle plus tard ?

Les packages Standard et Premium incluent un mécanisme de remplacement de modèle pour que vous (ou vos utilisateurs) puissiez insérer un modèle plus récent ou différent sans avoir besoin d'un nouvel installateur.

Vous gérez le fine-tuning ?

Le fine-tuning est une démarche distincte. Pour la plupart des cas d'usage, RAG (récupération à partir de vos propres documents) donne le même résultat pratique sans le coût et la complexité du fine-tuning. Je vous conseillerai honnêtement sur ce dont vous avez besoin.

Pouvez-vous signer un BAA HIPAA ?

Je ne signe pas de BAAs en tant que freelance solo, mais votre application peut être conforme HIPAA par conception — c'est exactement ce que je construis. Je vous expliquerai la différence lors de notre premier échange.

Qu'en est-il de la licence commerciale des modèles ?

Je n'utilise que des modèles avec des licences permissives (Phi-3 MIT, Llama 3 avec la licence commerciale de Meta, Mistral Apache 2.0, Qwen). Je vous informerai des implications de licence avant de finaliser le choix du modèle.

Besoin d'activer votre créativité ?

Vous cherchez un expert en technologie ?

Prêt à atteindre et convertir les consommateurs ?

Vous cherchez des rédacteurs ?

Faites fonctionner votre entreprise plus intelligemment

Je vais créer des applications desktop d'IA privées sur appareil

À propos de ce service

Découvrez Shashank

Mon portfolio

FAQ

Balises associées