Nouvelles de l'IA : Le chatbot qui dépasse ChatGPT dans les tests de référence

Découvrez les dernières nouvelles et mises à jour sur l'IA, notamment un nouveau chatbot performant qui dépasse ChatGPT, les dernières nouvelles d'OpenAI et les progrès passionnants dans la génération d'images et la conception 3D. Explorez l'évolution du paysage de l'intelligence artificielle et son impact sur la création de contenu.

15 janvier 2025

Découvrez les dernières avancées dans le monde de l'IA, notamment le nouveau chatbot performant, les passionnants modèles de langue open source et les outils innovants qui redéfinissent la création de contenu. Restez à la pointe de l'innovation et apprenez à tirer parti de ces technologies de pointe pour améliorer votre présence en ligne et votre stratégie de contenu.

Nouveau modèle de langage de grande taille de premier plan : Claude 3 Opus bat ChatGPT
Amazon investit 2,75 milliards de dollars dans la plateforme Claude d'Anthropic
Databricks publie un nouveau modèle de langage de grande taille, dBrx, qui surpasse les autres modèles open source
Le départ du PDG de Stability AI, Ahmad, discute de l'IA décentralisée
OpenAI monétise la boutique GPT, les créateurs peuvent gagner de l'argent grâce à l'utilisation
On dit qu'OpenAI va supprimer les quotas de GPT-4 et introduire un sélecteur de modèle intelligent
Aperçu des nouvelles vidéos SORA, discussions d'OpenAI avec Hollywood
Hume : le premier chatbot avec de l'empathie, conçu pour les interactions vocales
Adobe lance Gen Studio, un hub central pour la conception créative avec l'IA
Nouvelles fonctionnalités vidéo IA : Habitar In Motion 1.0 et lancement de LTX Studio
Le MIT présente la distillation d'appariement de distribution, une génération d'images plus rapide
Leonardo AI ajoute le modèle Lightning XL et la fonctionnalité de suppression d'arrière-plan
Bezi AI : une nouvelle application de conception 3D avec génération d'objets 3D à partir de texte
Quellcop AI : un agent IA jouant à Minecraft avec les commentaires vocaux de Quellcop
Conclusion

Nouveau modèle de langage de grande taille de premier plan : Claude 3 Opus bat ChatGPT

Selon la plateforme collaborative Chatbot Arena, le modèle premium de Claude, appelé Claude 3 Opus, est officiellement devenu le modèle de langage le plus performant, détrônant le longtemps régnant ChatGPT.

Claude 3 Opus, qui coûte 20 $ par mois, a été élu meilleur modèle par de vrais utilisateurs humains sur la plateforme. Ce détrônement de ChatGPT marque un changement significatif dans le paysage des modèles de langage IA.

De plus, Amazon a annoncé qu'il investira 2,75 milliards de dollars supplémentaires dans Anthropic, la société derrière la plateforme Claude. Cet investissement consolide l'intérêt d'Amazon pour le modèle Claude et son potentiel.

Bien que Claude ne propose pas de génération d'images ou de recherche sur le web comme ChatGPT, il a été démontré qu'il surpasse ChatGPT dans divers autres cas d'utilisation. Les utilisateurs sont encouragés à essayer Claude et à découvrir ses capacités par eux-mêmes.

Amazon investit 2,75 milliards de dollars dans la plateforme Claude d'Anthropic

Amazon a annoncé qu'il investira 2,75 milliards de dollars supplémentaires dans Anthropic, la société derrière le chatbot IA populaire Claude. Cet investissement fait suite au premier investissement d'Amazon de 1,25 milliard de dollars et lui donnera une participation minoritaire dans Anthropic. Cependant, Amazon n'aura pas de siège au conseil d'administration d'Anthropic.

Cet accord est similaire à celui de Microsoft avec OpenAI, car Amazon cherche à s'associer à une entreprise IA de premier plan et à son produit phare. Cet investissement aidera probablement Anthropic à continuer à développer et à améliorer la plateforme Claude, qui a récemment dépassé GPT-4 comme le chatbot le plus performant selon les votes des utilisateurs sur la plateforme Chatbot Arena.

Le financement supplémentaire d'Amazon permettra à Anthropic de développer davantage ses opérations et de continuer à innover dans le domaine des modèles de langage et de l'IA conversationnelle. Ce partenariat pourrait également conduire à une intégration plus approfondie entre la plateforme Claude et les propres services IA et de cloud computing d'Amazon à l'avenir.

Databricks publie un nouveau modèle de langage de grande taille, dBrx, qui surpasse les autres modèles open source

Databricks, une entreprise de données et d'IA de premier plan, a récemment publié un nouveau modèle de langage de grande taille appelé dBrx (ou D-bricks). Selon les tests de référence et l'article de blog de l'entreprise, ce nouveau modèle surpasse tous les autres modèles open source dans diverses tâches.

En compréhension du langage, dBrx a battu LLaMA 2, Mixol et Grok 1. Il a également surpassé ces modèles dans les tâches de programmation et de mathématiques. De plus, le nouveau modèle dBrx a réussi à battre la version gratuite de GPT-3.5 dans tous les tests de référence.

Les poids du modèle dBrx sont disponibles sur Hugging Face, mais l'entreprise exige que les utilisateurs fassent une demande et obtiennent une approbation avant de pouvoir télécharger le modèle. Ce nouveau modèle open source de Databricks semble être un concurrent solide dans le paysage des modèles de langage de grande taille, offrant des performances impressionnantes dans une gamme de tâches.

Le départ du PDG de Stability AI, Ahmad, discute de l'IA décentralisée

Il y a eu de grandes nouvelles dans le monde de l'open source cette semaine chez Stability AI. Ahmad Mustak, le PDG de Stability AI, a apparemment démissionné de son poste de PDG de manière abrupte et a renoncé à son poste au conseil d'administration. Les spéculations indiquent qu'il a été en quelque sorte forcé de partir, plutôt que de démissionner réellement, mais les informations publiques sur toute cette affaire ont fait paraître la décision comme étant à l'amiable.

Stability AI a connu une période tumultueuse récemment, la plupart des principaux employés et ingénieurs ayant en fait quitté l'entreprise au cours des derniers mois. En fait, il n'est pas clair si quelqu'un qui a initialement travaillé sur Stable Diffusion travaille encore chez Stability AI, car ils sont tous partis au cours des deux derniers mois. Il y a également eu beaucoup de rumeurs sur le fait que Stability AI pourrait déposer le bilan et avoir des problèmes financiers.

Le départ d'Ahmad semble confirmer ces problèmes chez Stability AI. Dans sa déclaration, Ahmad a déclaré que ses actions ont la majorité des voix chez Stability AI et qu'ils ont le contrôle total du conseil d'administration. Il a affirmé que la concentration du pouvoir dans l'IA est mauvaise pour nous tous, et qu'il a décidé de démissionner pour remédier à cela chez Stability AI et ailleurs. Il a également mentionné qu'il est "tout à fait engagé dans l'IA décentralisée", mais il n'est pas clair quels sont ses projets ou ce qu'il entend par IA décentralisée.

Malgré le départ d'Ahmad, Stability AI n'a pas ralenti. Le lendemain même de sa démission, ils ont annoncé Stable Code Instruct 3B, un nouveau modèle de langage de grande taille pour le codage, apparemment pour montrer que l'entreprise continuera à expédier même sans Ahmad à la barre.

OpenAI monétise la boutique GPT, les créateurs peuvent gagner de l'argent grâce à l'utilisation

OpenAI commence maintenant à monétiser la boutique GPT. Auparavant, les utilisateurs pouvaient créer des modèles GPT personnalisés et les rendre disponibles dans la boutique GPT, mais il n'y avait aucun moyen pour eux de gagner de l'argent avec l'utilisation de leurs modèles.

Cette semaine, OpenAI a annoncé un programme pilote pour s'associer aux créateurs et leur permettre de gagner de l'argent en fonction de l'utilisation de leurs modèles GPT. Les créateurs qui ont des modèles GPT très utilisés dans la boutique sont invités à participer à ce programme.

Un exemple est l'outil "Automated Writer", dont le créateur Matt Schit a reçu un e-mail d'OpenAI indiquant que son modèle GPT est très utilisé et qu'ils aimeraient intégrer ses commentaires alors qu'ils définissent l'approche de la monétisation de GPT.

Un autre créateur, Nick Doos, qui a construit le modèle "Gamer GPT" populaire, a été informé qu'il pourrait gagner un minimum de 11 000 USD par mois avec l'utilisation de son modèle GPT, avec un potentiel de gains supplémentaires.

Cette nouvelle initiative d'OpenAI débutera le 1er mai 2024, avec le premier paiement prévu pour la mi-juin. Elle offre aux créateurs l'opportunité de monétiser leurs modèles GPT personnalisés et de gagner de l'argent avec l'utilisation par les utilisateurs de ChatGPT.

On dit qu'OpenAI va supprimer les quotas de GPT-4 et introduire un sélecteur de modèle intelligent

Il circule une rumeur selon laquelle OpenAI s'apprête à supprimer les quotas de GPT-4. Une image divulguée montre un "Sélecteur de modèle intelligent" qui pourrait bientôt arriver. Cette fonctionnalité décidera essentiellement s'il faut utiliser GPT-3.5 ou GPT-4 lorsqu'un utilisateur pose une question. Si la requête ne nécessite pas les pleines capacités de GPT-4, elle utilisera le modèle GPT-3.5 moins coûteux. Mais si la requête nécessite une réponse plus complexe, elle utilisera GPT-4. C'est ainsi qu'OpenAI semble prévoir de supprimer les limites d'utilisation - en basculant dynamiquement entre le modèle le plus optimal pour chaque requête.

Aperçu des nouvelles vidéos SORA, discussions d'OpenAI avec Hollywood

Nous avons également eu un aperçu de nouvelles vidéos Sora cette semaine. Sora a été mis à la disposition de quelques créateurs et bien que je ne vais pas vous montrer toutes les vidéos qui ont été réalisées par ces créateurs, elles sont super impressionnantes. L'une d'entre elles provient même d'un ami à moi, Don Allen Stevenson, donc c'est vraiment cool de voir qu'il a eu un accès anticipé à Sora et qu'il a pu réaliser des vidéos avec ces créatures hybrides folles comme un cochon volant et un hybride flamant rose-girafe et des baleines-calmars ou des baleines-poulpes. Vraiment des trucs super cool.

L'une des vidéos les plus remarquables qui circule beaucoup s'appelle Airhead par shy kids, à propos d'une personne qui a un ballon pour tête, et c'est une véritable bonne histoire. Encore une fois, je ne veux pas diffuser cette vidéo ici, je ne connais pas les droits d'auteur sur ces vidéos, mais je vais joindre ce post dans la description ci-dessous afin que vous puissiez consulter certaines des nouvelles vidéos qui circulent de Sora. Encore une fois, tout comme la dernière fois, elles sont vraiment impressionnantes.

Et pendant que nous en parlons, apparemment OpenAI a discuté avec l'industrie du cinéma, en parlant à des gens à Hollywood, pour essayer de les faire adhérer au logiciel Sora. Évidemment, Hollywood est un segment du monde qui a eu très peur de l'IA car elle menace les comédiens doubleurs, les acteurs, les animateurs, les scénaristes. Il y a beaucoup de rôles à Hollywood que l'IA menace actuellement, et OpenAI fait en quelque sorte une tournée pour essayer de faire accepter et utiliser l'IA comme un outil qui facilitera leur vie, réduira les budgets des vidéos, et idéalement ne remplacera pas les emplois, mais aidera les gens qui font le travail à être beaucoup plus efficaces.

Hume : le premier chatbot avec de l'empathie, conçu pour les interactions vocales

Hume est un nouveau chatbot qui prétend être le premier à avoir une véritable empathie. Contrairement aux modèles de langage typiques, Hume est construit sur des insights approfondis de la science des émotions, lui permettant de comprendre et de répondre aux expressions humaines, et pas seulement aux mots.

Hume est conçu pour les interactions vocales, utilisant le ton de voix de l'utilisateur pour détecter ses émotions et adapter ses réponses en conséquence. S'il détecte de la frustration, il essaiera de comprendre et de répondre aux préoccupations de l'utilisateur. S'il perçoit de la joie ou de la légèreté, il répondra de manière plus ludique.

La mission de Hume est d'aligner l'IA avec le bien-être humain. En se concentrant sur l'intelligence émotionnelle, le chatbot vise à avoir des conversations plus naturelles et empathiques, offrant une expérience plus positive aux utilisateurs.

Bien que la démo vocale actuelle ne soit pas entièrement réaliste, l'équipe de Hume privilégie probablement la recherche et la fonctionnalité sous-jacentes plutôt que l'audio poli. À mesure que la technologie mûrira, les voix deviendront probablement plus naturelles et réalistes.

Dans l'ensemble, Hume représente une étape intéressante dans le développement de chatbots capables de vraiment comprendre et répondre aux émotions humaines, plutôt que de simplement traiter le langage. Il sera intéressant de voir comment cette technologie évolue et est appliquée dans divers cas d'utilisation.

Adobe lance Gen Studio, un hub central pour la conception créative avec l'IA

Adobe a annoncé le lancement d'Adobe Gen Studio, une nouvelle plateforme qui sert de centre névralgique pour les travaux de conception créative, y compris l'utilisation de l'IA. Voici quelques-unes des principales fonctionnalités de Gen Studio :

Onglet Marques : Permet de gérer vos actifs de marque comme les logos, les couleurs, les polices, les images et le texte en un seul endroit.
Intégration de Firefly : Permet de générer des images directement dans la plateforme à l'aide du modèle IA Firefly d'Adobe.
Gestion de campagne : Fournit des outils pour construire et gérer des campagnes sur diverses plateformes de médias sociaux.
Analytique et rapports : Inclut des données et des statistiques pour suivre les performances de vos campagnes créatives.

La plateforme vise à offrir une solution complète pour gérer tous vos besoins de conception créative, intégrant de manière transparente les capacités IA comme Firefly pour la génération d'images. Cela centralise vos actifs de marque, vos flux de travail créatifs et le suivi des performances dans une seule interface.

Bien que Gen Studio ne soit pas encore largement disponible, l'annonce suggère que l'accent mis par Adobe sur l'autonomisation des créatifs avec des outils et des flux de travail alimentés par l'IA se poursuit. À mesure que la plateforme se déploiera plus largement, il sera intéressant de voir comment elle sera adoptée et utilisée par les designers et les marketeurs.

Nouvelles fonctionnalités vidéo IA : Habitar In Motion 1.0 et lancement de LTX Studio

Jen a lancé une nouvelle fonctionnalité géniale appelée Habitar In Motion 1.0. Cette fonctionnalité vous permet de bouger les mains, de faire des gestes et d'utiliser des tons de voix uniques, et elle suivra, traduira et synchronisera parfaitement vos lèvres avec n'importe quel texte d'entrée. Les vidéos de démonstration sont impressionnantes, montrant une personne qui se déplace, bouge les mains, tandis que l'audio est doublé et les lèvres restent synchronisées avec le nouvel audio.

LTX Studio a également organisé sa fête de lancement cette semaine, et ils commencent maintenant à donner accès aux personnes sur la liste d'attente pour essayer la version bêta. LTX Studio est un outil où vous pouvez entrer une seule invite et il construit tout le story-board à partir de cette invite. Il peut maintenir des personnages cohérents tout au long des scènes, en faire une puissante plateforme de création vidéo tout-en-un. Le créateur est enthousiaste à l'idée de se plonger dans LTX Studio et de le mettre à l'épreuve, et prévoit de publier une vidéo à ce sujet lundi.

Le MIT présente la distillation d'appariement de distribution, une génération d'images plus rapide

Des chercheurs du MIT ont présenté une nouvelle méthode de génération d'images appelée "distribution matching distillation" qui peut générer des images 30 fois plus rapidement que Stable Diffusion tout en maintenant ou en dépassant le niveau de qualité des résultats.

L'exemple montre à quelle vitesse le nouveau modèle génère les mêmes quatre images par rapport à Stable Diffusion. Le nouveau modèle semble capable de générer rapidement des images de haute qualité, ce qui pourrait être exploité par diverses plateformes d'images IA dans un avenir proche.

Cette avancée dans la vitesse de génération d'images, tout

FAQ

Quel est le nouveau modèle de langage de grande taille le plus performant selon la plupart des référentiels ?

Combien Amazon investit-il dans Anthropic, la société derrière le modèle de langage Claude ?

Quel est le nouveau modèle de langage de grande taille open-source appelé Dbrx ou Dbricks, et comment se compare-t-il aux autres modèles ?

Que s'est-il passé avec le PDG de Stability AI, Ahmad Mostafa, et quelles en sont les implications pour l'entreprise ?

Quelle nouvelle fonctionnalité est déployée par OpenAI pour permettre aux créateurs de générer des revenus à partir de leurs modèles GPT personnalisés ?

Quel nouveau chatbot appelé Hume est réputé avoir de l'empathie et comment fonctionne-t-il ?

Quelles nouvelles fonctionnalités ont été introduites par Adobe lors de leur événement Summit ?

Quelle nouvelle fonctionnalité de génération vidéo alimentée par l'IA appelée Habitar In Motion 1.0 a été introduite par Jen ?

Quelle nouvelle application de conception de texte en 3D appelée Bezi AI a été introduite, et que peut-elle faire ?

Quel nouveau système de jeu et de commentaires Minecraft alimenté par l'IA appelé Quelcop AI a été introduit ?