OpenAI dévoile GPT-4o, un modèle multimodal révolutionnaire améliorant les interactions naturelles avec des capacités textuelles, vocales et visuelles.
OpenAI lance GPT-4o (« o » pour « omni »), son dernier modèle de langage multimodal, avec des avancées majeures en génération de contenu textuel, vocal et visuel. Ce modèle vise à améliorer l’interaction naturelle entre les utilisateurs et l’assistant.
Selon OpenAI, ce nouveau modèle AI répond aux entrées audio en seulement 232 millisecondes et se montre beaucoup plus rapide dans ses réponses textuelles pour les requêtes non anglophones, prenant en charge plus de 50 langues. De plus, il permet d’interrompre le modèle avec de nouvelles questions ou clarifications pendant son discours.
GPT-4o propose également un assistant vocal plus performant, avec une voix proche de celle des humains et une réponse en temps réel. Cet assistant peut observer l’environnement grâce à la caméra du dispositif utilisé. Il est possible de demander à l’assistant de changer de ton pour paraître plus joyeux ou de revenir à une voix plus robotique. Les traductions en temps réel couvrent plus de 50 langues, et l’assistant peut aussi servir d’aide à l’accessibilité pour les malvoyants.
OpenAI a présenté une longue liste des capacités de GPT-4o lors de son live stream, disponible sur la chaîne YouTube d’OpenAI pour découvrir toutes les nouvelles fonctionnalités de GPT-4o.
GPT-4o sera accessible aux utilisateurs de la version gratuite de ChatGPT, tandis que ceux avec un abonnement ChatGPT Plus bénéficieront de limites de messages cinq fois plus élevées. Les fonctionnalités textuelles et visuelles de GPT-4o sont déjà disponibles dans l’application ChatGPT et sur le web. Le mode vocal, quant à lui, sera proposé en version alpha pour les abonnés ChatGPT Plus dans les semaines à venir.
Par ailleurs, OpenAI a annoncé une application de bureau ChatGPT pour macOS, avec une version Windows prévue plus tard cette année. OpenAI a également lancé son ChatGPT Store, qui héberge des millions de bots personnalisés accessibles gratuitement pour les utilisateurs.



0 commentaires