C’est une étape de plus dans la course au développement des intelligences artificielles grand public. L’entreprise américaine OpenAI a présenté ce lundi une nouvelle version de ChatGPT, capable désormais de tenir des conversations orales et fluides avec ses utilisateurs. Grâce à ce nouveau modèle nommé GPT-4o («o» pour «omni»), l’IA sera en mesure de comprendre aussi bien du texte que du son et des images, ainsi que de répondre à l’écrit, par la voix ou en générant des images. Ces nouvelles capacités vont être progressivement ajoutées à la technologie existante sur le marché, d’abord le texte et l’image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d’usage. La nouvelle version du mode vocal doit arriver dans les prochaines semaines pour les abonnés.
Le départ finalement avorté de Sam Altman de la direction d’OpenAI, en novembre, avait fait émerger un litige entre les défe