L’intelligence artificielle conversationnelle ChatGPT s’apprête à franchir une nouvelle étape dans son évolution. OpenAI, l’entreprise à l’origine de cette technologie, a récemment annoncé le développement de fonctionnalités vocales avancées pour son modèle GPT-4o. Bien que l’attente soit un peu plus longue que prévu, ces innovations promettent de transformer radicalement notre interaction avec l’IA.
Un déploiement progressif et repoussé
Initialement prévue pour fin juin, la phase alpha des nouvelles fonctionnalités linguistiques a été reportée à fin juillet. OpenAI justifie ce délai par deux raisons principales. D’une part, les développeurs travaillent encore à affiner la capacité du modèle à reconnaître les contenus inappropriés, afin d’éviter tout dérapage. D’autre part, l’infrastructure nécessaire pour gérer le passage du texte à la voix en temps réel pour des millions d’utilisateurs requiert une préparation minutieuse.
Le déploiement se fera de manière progressive, en commençant par un groupe restreint d’utilisateurs de ChatGPT Plus, avant de s’étendre à l’ensemble des abonnés d’ici l’automne.
Vers un assistant plus humain et polyvalent
Au-delà des améliorations linguistiques, OpenAI développe également des fonctionnalités de partage d’écran et de vidéo. L’assistant sera capable d’analyser le contenu de votre écran ou les enregistrements de votre caméra, ouvrant la voie à de nouvelles possibilités d’interaction.
Un exemple concret de ces avancées a été démontré par Microsoft, partenaire d’OpenAI, avec l’assistant CoPilot basé sur GPT-4o. Ce dernier a pu fournir des conseils en temps réel à un joueur de Minecraft pour l’aider dans ses constructions.
Des performances impressionnantes, mais à confirmer
Les améliorations apportées à ChatGPT visent à le rendre plus humain dans ses interactions. Son temps de réaction pourrait être réduit à 320 millisecondes, se rapprochant ainsi de celui d’un interlocuteur humain. De plus, le chatbot pourrait bientôt être capable de simuler des réactions émotionnelles, comme la surprise ou le sarcasme, en fonction des requêtes reçues.
Cependant, il est important de noter que ces annonces ont été faites dans le cadre de démonstrations contrôlées. Le véritable défi sera de maintenir ces performances face à des milliers de requêtes simultanées dans un contexte d’utilisation réelle.
Lire plus d’article sur DigiTechnologie :
– Découvrez les 5 meilleurs prompteurs en ligne, cliquez-ici
– Guide d’accès au metaverse pour les débutants, cliquez-ici
– La promesse d’une batterie éternelle par Betavolt, cliquez-ici
– Utilisez Videovor pour convertir vos vidéos YouTube, cliquez-ici
– Astuces pour obtenir Canva Pro Premium sans frais, cliquez-ici
– Top des logiciels pour créer des questionnaires en ligne, cliquez-ici
– L’orthographe correcte entre je vous joins et je vous joint, cliquez-ici
– Guide complet des convertisseurs Youtube en MP3 gratuits, cliquez-ici
– Les sites incontournables pour le streaming de films et séries, cliquez-ici
– Comparatif entre Brave et Firefox pour choisir votre navigateur, cliquez-ici
– Pono Technologies révolutionne le financement des entreprises, cliquez-ici