ChatGPT-4o, le nouveau modèle d’IA générative d’OpenAI qui fournit un mode vocal innovant à ChatGPT, est le premier IA formé à la fois sur la voix ainsi que sur des données textuelles et des images. Quelques utilisateurs des États-Unis et même OpenAI ont constaté qu’il se comportait bizarrement, par exemple, en imitant la voix de son interlocuteur ou en criant de manière étrange au milieu d’une conversation.
Dans un nouveau rapport, l’équipe d’OpenAI a pu documenter les comportements du nouveau modèle GPT -o4. Il est ainsi ressorti que l’IA présentait certaines bizarreries étranges, comme l’imitation de la voix de l’utilisateur. Prenons ce cas précis : dans de rares occasions, lorsqu’une personne communique avec GPT-4o dans un « environnement bruyant », comme une voiture sur la route, l’IA générative « semble imiter sa voix ».
Pour quelle raison ? L’entreprise avance qu’elle a elle-même du mal à comprendre les paroles parfois incompréhensibles. Pour être plus clair, il se pourrait que ChatGPT-4o présente ce comportement depuis quelque temps. Un porte-parole d’OpenAI explique que l’entreprise a ajouté une atténuation de la voix au niveau du système pour gérer ce comportement.
ChatGPT-4o a également tendance à générer des effets sonores inappropriés tels que des gémissements érotiques, des cris violents lorsqu’il est sollicité dans des conditions spécifiques. OpenAI affirme que son IA de langage conversationnel est capable de rejeter généralement les demandes d’effets sonores comme les gémissements, les coups de feu… mais reconnaît que certaines de ces demandes aboutissent.
GPT-4o pourrait également enfreindre les droits d’auteur musicaux. Seulement, pour l’empêcher, OpenAI a mis en place des filtres pour l’en empêcher. Dans le rapport indiqué plus haut, l’entreprise précise qu’elle a demandé à GPT-4o de ne pas chanter dans un mode vocal avancé, ceci, dans le but d’éviter de copier le style, le ton et/ou le timbre d’artistes reconnaissables.
Toutefois, cela ne veut pas dire qu’OpenAI n’a formé pas GPT-4o avec du matériel protégé par les droits d’auteur. Autre chose intrigante, l’entreprise a l’intention de lever les restrictions sur le mode vocal avancé lorsque cette option atteindra un plus grand nombre d’utilisateurs dans quelques mois notamment. Alors, en ce moment-là, comment va-t-elle procéder ?
Pour rassurer, elle affirme : « Nous avons formé GPT-4o pour qu’il rejette les demandes de contenus protégés par le droit d’auteur, y compris les contenus audio, conformément à nos pratiques générales ».
Comme Google avec Google Actualités, OpenAi a eu à faire face à la colère de certains médias américains qui n’ont pas hésité à porter plainte. On pense notamment au Chicago Tribune, au New York Time et 7 autres journaux qui ont porté plainte à OpenAI et Microssoft pour violation des droits d’auteur en mai 2024.
L’entreprise avait rétorqué qu’il était tout simplement impossible d’entraîner des modèles de langages d’IA sans les contenus récents se trouvant sur internet. Cela montre qu’au-delà de se comporter bizarrement dans certaines circonstances, ChatGPT -4o et d’autres IA doivent faire face à des questions juridiques complexes.
Depuis la domination de Google sur diverses plateformes et outils, la Justice américaine ne cesse…
Il est de notoriété publique que Google octroie des sommes importantes à Apple pour continuer…
Trouver une chaise gaming pas cher de bonne qualité avec une ergonomie digne des grandes…
Tous les utilisateurs des lunettes intelligentes Meta devront recevoir d’ici à quelques semaines une mise…
Faire un é majuscule peut sembler difficile au premier abord surtout quand on ne sait…
Au fil des versions d’Android, Google n’a pas cessé d’améliorer les performances de son système…