人工智能新闻: 超越ChatGPT的基准测试聊天机器人

探索最新的人工智能新闻和更新,包括一款新的表现出色的聊天机器人超越了 ChatGPT,OpenAI 的最新动态,以及图像生成和 3D 设计方面的令人兴奋的进展。探索人工智能不断发展的景观及其对内容创作的影响。

2025年1月15日

party-gif

探索人工智能领域的最新进展,包括新的顶级聊天机器人、令人兴奋的开源语言模型以及正在重塑内容创作的创新工具。保持领先地位,了解如何利用这些尖端技术来增强您的在线形象和内容策略。

新一代大型语言模型: Claude 3 Opus 超越 ChatGPT

根据众包平台Chatbot Arena的数据,名为Claude 3 Opus的Claude高级版已正式成为表现最佳的大型语言模型,超越了长期占据榜首的ChatGPT。

Claude 3 Opus每月收费20美元,已被该平台的真实用户评为表现最佳的模型。这一对ChatGPT的取代标志着AI语言模型格局发生了重大转变。

此外,亚马逊宣布将向Claude背后的公司Anthropic再投资27.5亿美元。这一投资巩固了亚马逊对Claude模型及其潜力的兴趣。

虽然Claude可能无法像ChatGPT那样提供图像生成或网络搜索功能,但它在其他各种应用场景中都表现出色。用户被鼓励尝试使用Claude,亲身体验其功能。

亚马逊投资27.5亿美元进入Anthropic的Claude平台

亚马逊宣布将向Claude背后的公司Anthropic再投资27.5亿美元。这一投资来自于亚马逊之前的12.5亿美元投资,将使亚马逊获得Anthropic的少数股权,但不会在Anthropic董事会中获得席位。

这笔交易类似于微软与OpenAI的合作,因为亚马逊希望与一家领先的AI公司及其旗舰产品建立合作关系。这笔额外资金将有助于Anthropic继续发展和改进Claude平台,该平台最近在Chatbot Arena用户投票中超越了GPT-4,成为表现最佳的聊天机器人。

来自亚马逊的额外资金将使Anthropic能够进一步扩大其业务规模,并继续在大型语言模型和对话式AI领域进行创新。这种合作关系还可能导致Claude平台与亚马逊自身的AI和云计算服务之间实现更深入的集成。

Databricks发布新型大型语言模型dBrx,超越其他开源模型

领先的数据和AI公司Databricks最近发布了一种名为dBrx(或D-bricks)的新型大型语言模型。根据基准测试和公司博客文章,这种新模型在各种任务中都超越了其他所有开源模型。

在语言理解方面,dBrx战胜了LLaMA 2、Mixol和Grok 1。它在编程和数学任务中也优于这些模型。此外,新的dBrx模型还能在每个基准测试中击败GPT-3.5的免费版本。

dBrx模型的权重已在Hugging Face上公开,但该公司要求用户申请并获得批准后才能下载该模型。这款来自Databricks的新开源模型似乎在大型语言模型格局中是一个强劲的竞争者,在各种任务中都展现出令人印象深刻的性能。

Stability AI首席执行官Ahmad离职,探讨去中心化人工智能

本周在开源领域有一些重大新闻。Stability AI的CEO Ahmad Mustak似乎突然辞去了CEO职务,并放弃了董事会席位。外界猜测他可能是被迫离职,而不是自愿辞职,但公开信息显示这是一个友好的决定。

Stability AI最近经历了动荡,大部分关键员工和工程师在过去几个月内都离开了公司。事实上,最初参与Stable Diffusion的人员似乎已全部离开Stability AI,他们在过去几个月内纷纷离职。还有很多关于Stability AI可能申请破产和面临财务问题的传言。

Ahmad的离职似乎证实了Stability AI的这些问题。在他的声明中,Ahmad表示他拥有Stability AI的多数投票权和完全的董事会控制权。他声称AI集中度对我们所有人都不利,因此决定辞职以在Stability AI及其他地方纠正这一问题。他还提到自己"全身心投入去中心化AI

OpenAI将货币化GPT商店,创作者可从使用中获利

但他的具体计划和所谓的去中心化AI含义尚不清楚。\n\n尽管Ahmad离职

OpenAI传闻将取消GPT-4配额,引入智能模型选择器

Stability AI并未放缓步伐。在他辞职的第二天

一窥SORA新视频,OpenAI与好莱坞的对话

该公司就宣布了新的编码大型语言模型Stable Code Instruct 3B

Hume:首个具有同理心的聊天机器人,为语音交互而设计

似乎是为了表明公司在没有Ahmad领导的情况下仍将继续推出新产品。

Adobe推出Gen Studio,一个集创意设计与AI于一体的中心枢纽

OpenAI现在开始为GPT商店进行货币化。此前,用户可以创建自定义的GPT模型并在GPT商店中提供,但无法从模型的使用中获得收益。

本周,OpenAI宣布启动一个试点计划,与开发者合作,允许他们根据GPT模型的使用情况获得收益。被邀请参与该计划的是那些在商店中拥有高使用率GPT模型的开发者。

一个例子是"Automated Writer"工具,其创建者Matt Schit收到了OpenAI的电子邮件,表示他的GPT模型使用率很高,他们希望在定义GPT货币化方法时吸收他的反馈。

另一位创建者Nick Doos,开发了流行的"Gamer GPT"模型,被告知他每月可以从模型的使用中至少获得11,000美元的收益,还有可能获得更多收益。

这项来自OpenAI的新举措将于2024年5月1日开始,首次支付将于6月中旬进行。这为创作者提供了一个机会,可以从他们的自定义GPT模型的使用中获得收益。

新AI视频功能:Habitar In Motion 1.0和LTX Studio启动

有传言称OpenAI即将取消GPT-4的使用配额。一张泄露的图像显示了一个"智能模型选择器

麻省理工学院引入分布匹配蒸馏,加快图像生成

可能即将推出。这个功能将决定在用户提出问题时是使用GPT-3.5还是GPT-4。如果查询不需要GPT-4的全部功能

Leonardo AI添加Lightning XL模型和背景去除功能

它将使用成本较低的GPT-3.5模型。但如果查询需要更复杂的响应

Bezi AI:一款具有文本到3D对象生成功能的新3D设计应用

它将使用GPT-4。这似乎是OpenAI计划取消使用限制的方式 - 通过动态切换到每个查询最优的模型。

Quellcop AI:一个在Minecraft中由Quellcop语音解说的AI代理

我们也看到了一些新的Sora视频。Sora已向少数创作者开放,虽然我不会在这里展示所有这些创作者制作的视频,但它们确实非常出色。其中一个视频来自我的朋友Don Allen Stevenson,很高兴看到他获得了Sora的早期访问权,并能够制作出这些令人惊叹的混合生物,如会飞的猪和火烈鸟长颈鹿混合体,以及鲸鱼乌贼。真的非常酷。

一个引人注目的视频是由shy kids制作的"Airhead

结论

讲述了一个头部是气球的人的故事

这确实是一个很好的故事情节。再次声明

我不想在这里播放这个视频

因为我不知道这些视频的版权情况

但我会在下面的描述中链接这篇文章

供你查看一些新的Sora视频。和上次一样

它们确实非常出色。\n\n说到Sora

据悉OpenAI一直在与电影业接触

试图让他们接受Sora软件。显然

好莱坞是一个非常害怕AI的群体

因为它威胁到了配音演员、演员、动画师和编剧等很多角色。OpenAI正在努力说服好莱坞的人接受并利用AI作为一种工具

使他们的工作更加高效

降低成本

理想情况下不会取代工作

而是帮助那些从事这些工作的人更加高效。

Hume是一款声称拥有真正同理心的新型聊天机器人。与典型的语言模型不同,Hume建立在情感科学的深入见解之上,使其能够理解和响应人类的表达,而不仅仅是语言。

Hume专为语音交互而设计,使用用户的语气来检测他们的情绪,并相应地调整自己的响应。如果它检测到沮丧,它会试图理解并解决用户的担忧。如果它感知到快乐或幽默,它会以更有趣的方式进行回应。

Hume的使命是将AI与人类福祉保持一致。通过专注于情商,这款聊天机器人旨在进行更自然、更富同理心的对话,为用户提供更积极的体验。

虽然目前的语音演示可能并不完全真实,但Hume团队可能将底层研究和功能性作为优先事项,而不是精致的音频。随着技术的成熟,语音将可能变得更加自然和生动。

总的来说,Hume代表了聊天机器人发展的一个有趣的步骤,它们能真正理解和响应人类情绪,而不仅仅是处理语言。它将如何发展并应用于各种用例都值得关注。

Adobe宣布推出Adobe Gen Studio,这是一个新的创意设计工作中心,包括使用AI。Gen Studio的一些关键功能包括:

  • 品牌标签: 允许您在一个地方管理您的品牌资产,如徽标、颜色、字体、图像和文案。
  • Firefly集成: 使您能够直接在平台内使用Adobe的Firefly AI模型生成图像。
  • 活动管理: 提供工具来构建和管理跨多个社交媒体平台的活动。
  • 分析和报告: 包括数据和统计信息,以跟踪您的创意活动的表现。

该平台旨在为管理所有创意设计需求提供一个综合解决方案,无缝集成Firefly等AI功能。这将您的品牌资产、创意工作流程和绩效跟踪集中在一个界面中。

虽然Gen Studio目前尚未广泛推出,但该公告表明Adobe继续专注于为创意人员提供AI驱动的工具和工作流程。随着该平台的更广泛推出,它将如何被设计师和营销人员采用和利用将是一个有趣的观察点。

Jen推出了一个名为Habitar In Motion 1.0的新功能。这个功能允许你移动双手、做手势,并使用独特的语气,它将无缝地跟踪、翻译和为任何输入文本进行嘴型同步。演示视频看起来很出色,展示了一个人在走动、挥手的同时,音频被替换,但嘴唇仍与新的音频同步。

LTX Studio也在本周举行了发布派对,他们现在开始为等待名单上的人提供尝试测试版的机会。LTX Studio是一个工具,你只需输入一个提示,它就可以构建整个分镜头,并在场景中保持角色的一致性,这使它成为一个强大的一体化视频创作平台。创作者很兴奋能深入探索LTX Studio,并计划在周一发布一个关于它的视频。

MIT的研究人员引入了一种名为"分布匹配蒸馏"的新图像生成方法,该方法可以在保持或超越输出质量水平的同时,以比稳定扩散快30倍的速度生成图像。

该示例展示了新模型生成相同四张图像的速度,与稳定扩散相比有明显优势。新模型似乎能够快速生成高质量的图像,这可能会在不久的将来被各种AI图像平台所利用。

这种在保持质量的同时提高图像生成速度的进步,是一个令人兴奋的发展,可能会对AI驱动的图像创作领域产生重大影响。

本周,Leonardo AI推出了一项新功能,允许用户使用新的"Leonardo Lightning XL"模型快速生成图像。这个模型可以比稳定扩散快30倍生成图像,同时保持相似的质量水平。

要访问这个功能,用户可以进入"图像生成"部分,点击"微调模型"下拉菜单,选择"Leonardo Lightning XL"选项。这将允许他们快速生成图像,以"lightning"为提示的示例只需大约10秒就能产生四张图像。

除了这个全新的闪电般快速的生成模型,Leonardo AI上周还推出了一个背景移除功能。用户现在可以点击任何图像上的"移除背景"按钮,该工具将生成一个背景被移除的图像版本,可以下载为PNG文件。

这些新功能进一步增强了Leonardo AI平台的功能,为用户提供更快的图像生成和轻松移除生成图像背景的能力。

最近有一款名为Bezi AI的新3D设计应用程序引起了关注。它似乎是另一款基于文本的3D对象生成器,可以创建游戏就绪和电影就绪的资产。

注册后,你会获得一个免费的资产包,放在你的库中。该应用程序有一个现有3D资

常问问题