Je vais concevoir des modèles de reinforcement learning et de reasoning llms pour la recherche et les agents

Certaines informations ont été traduites automatiquement.
5,0
5,0

Inde

Je parle Anglais, Hindi, Marathi

8 commandes terminées

Je suis ingénieur en vision par ordinateur et data scientist. Intéressé à travailler sur des projets liés à l'apprentissage automatique. Également intéressé à travailler sur l'apprentissage par renfor...
À propos de ce service

Recherchez-vous un ingénieur en recherche en IA spécialisé en Deep Learning, Reinforcement Learning (RL) et raisonnement avec de grands modèles de langage (LLMs) ?

J’aide les chercheurs, startups et entreprises à concevoir, affiner et optimiser systèmes d’IA avancés qui vont au-delà de la simple génération de texte, permettant raisonnement, prise de décision et comportement d’agents intelligents.


Ce que je propose :

  • Développement de LLMs pour le raisonnement
  • Prompting en chaîne de pensée
  • LLMs augmentés par des outils et raisonnement en plusieurs étapes
  • Évaluation sur des tâches de raisonnement
  • Reinforcement Learning pour LLMs
  • RLHF (Reinforcement Learning avec feedback humain)
  • RLAIF (RL avec feedback IA)
  • Optimisation de politique pour l’alignement et la sécurité
  • Solutions personnalisées de Deep Learning
  • Architectures Transformer, embeddings, IA générative
  • Affinage pour des tâches spécifiques à un domaine (chatbots, recherche, résumé, agents)
  • Optimisation et déploiement
  • Compression de modèles (quantification, pruning, distillation)
  • API d’inférence évolutives et pipelines MLOps

️ Outils et frameworks :

  • Deep Learning : PyTorch, TensorFlow, JAX
  • RL & formation de LLMs : Hugging Face TRL, bibliothèques RLHF, PPO, CRPO DeepSpeed, Accelerate
  • Raisonnement avec LLMs : LangChain, API OpenAI, Anthropic, LLaMA, Mistral

Expertise:

Développement de logiciels

Langage de programmation:

Python

Avis

1 avis concernant ce service
5,0

(1)
(0)
(0)
(0)
(0)
Détails de la notation
  • Niveau de communication avec le freelance
    5
  • À recommander à un ami
    5
  • Service conforme à la description
    5
Trier par
Les plus pertinents
  • B

    billyjoel99

    US

    États-Unis

    5

    Ok thank you

    Utile?
    Oui
    Non
Avis

1 avis concernant ce service
5,0

(1)
(0)
(0)
(0)
(0)
Détails de la notation
  • Niveau de communication avec le freelance
    5
  • À recommander à un ami
    5
  • Service conforme à la description
    5
Trier par
Les plus pertinents
  • B

    billyjoel99

    US

    États-Unis

    5

    Ok thank you

    Utile?
    Oui
    Non