使用 Qwen-Agent 解锁强大的 AI 功能:函数调用、代码解释器和 RAG

使用 Qwen-Agent 解锁强大的 AI 功能,这是一个开源的多代理框架,集成了 Qwen 2 LLM 用于函数调用、代码解释和检索增强生成。了解它如何超越 RAG 和原生长上下文模型。

2024年10月18日

使用Qwen-Agent解锁AI的力量,这是一个尖端的多智能体框架,无缝集成了先进的Qwen 2大型语言模型。探索这个框架的功能,包括函数调用、代码解释和检索增强生成,如何将您的AI驱动项目提升到新的高度。

强大的多智能体框架:函数调用、代码解释器和 RAG

权代理是一个新的和先进的AI代理框架,建立在权2大型语言模型之上。它集成了几个强大的功能,包括函数调用、代码解释器、检索增强生成(RAG)和Chrome扩展。

这个框架旨在创造复杂的AI代理,能够超越其他多代理系统。权代理的一个关键特点是它能够处理大量上下文的复杂任务。该框架能够理解多达100万个令牌的文档,超越了RAG和原生长上下文模型的性能。

权代理使用四步方法将大型语言模型从8K上下文大小推广到百万令牌上下文:

初始模型:该框架从一个弱8K上下文聊天模型开始。
代理开发:该模型用于构建一个相对强大的代理,能够处理100万令牌的上下文。
数据合成:该代理用于合成高质量的微调数据,并进行自动过滤以确保质量。
模型微调:合成数据用于微调预训练模型,从而得到一个强大的100万令牌聊天机器人。

权代理的功能分为三个复杂性层次:

检索增强生成(RAG):这是一种简单的方法,可以处理100万令牌的上下文,将其划分为较短的块,并保留8K上下文中最相关的块。
逐块阅读:这种蛮力策略检查每个512令牌的块是否与查询相关,检索最相关的块,并生成最终答案。
逐步推理:这种方法使用多跳推理和工具调用代理来回答需要跨多个步骤理解的复杂问题。

权代理的出色性能和处理长上下文任务的能力使其成为一个强大的开源AI代理框架。开发人员可以通过从Pi网站安装该框架并遵循可用的教程来部署自己的代理和利用权2大型语言模型来入门。

为训练新的长上下文 Quin 模型生成数据

权代理被用于为训练新的长上下文权模型生成数据。这是一个重大成就,因为准备足够长的微调数据一直是研究可以本地处理百万级令牌序列的大型语言模型的一个挑战。

权代理使用的方法涉及四个步骤:

初始模型:该过程从一个弱8K上下文聊天模型开始作为初始模型。
代理开发:在这个阶段,权代理被用来构建一个相对强大的代理,能够处理100万上下文。
数据合成:然后使用该代理合成微调数据,并进行自动过滤以确保质量。
模型微调:最后,合成数据被用于微调预训练模型,从而得到一个强大的100万上下文聊天机器人。

这种方法利用了权代理的功能来克服为训练具有长上下文的大型语言模型准备数据的挑战。通过使用代理生成高质量的合成数据,研究人员能够微调一个可以有效处理多达100万个令牌序列的模型,超越了传统方法如RAG和原生长上下文模型的性能。

这种方法的成功突出了权代理框架的强大功能,以及它能够支持开发可以处理复杂任务和长篇内容的先进AI系统的能力。

构建智能体:三个复杂性层次

该代理构建包括三个复杂性层次,每一层都建立在前一层之上:

检索增强生成:
- 这是一种简单的方法,可以处理100万上下文长度。
- 它使用RAG(检索增强生成)算法。
- 它将上下文划分为较短的块,每个块不超过512个令牌。
- 它只保留8K上下文中最相关的块。
- 它有三个子步骤:
  - 分离指令和信息:区分用户查询中的指令和非指令部分。
  - 提取关键词:从查询的信息部分推断出多语言关键词。
  - 检索相关块:使用BM25算法找到最相关的块。
逐块阅读:
- 这种方法解决了RAG方法的局限性,即如果相关块与查询中的关键词不匹配,就可能被忽略。
- 它包括三个步骤:
  - 评估相关性:一个模型检查每个512令牌的块是否与查询相关。
  - 检索块:使用BM25算法,将相关句子用于检索8K上下文内最相关的块。
  - 生成答案:最终答案是基于检索到的上下文生成的,类似于RAG方法。
逐步推理:
- 这种方法用于基于文档的问答,需要进行多跳推理。
- 它利用工具调用代理,这些代理有多种工具,如"向LV3代理提问"、"子问题"、"更新记忆"等。
- 这种方法允许模型将上下文增加到100万个令牌,并提高各种功能的质量。

实验表明,权代理能够显著提高上下文长度和性能,与其他基于RAG的模型相比有很大改进。

检索增强生成 (RAG)

代理构建的第一层是检索增强生成(RAG)方法。这是一种简单的方法,我们之前已经看到过很多次了。它可以处理100万上下文长度,并使用RAG算法。

该过程包括:

划分上下文:将上下文划分为较短的块,每个块不超过512个令牌。
保留相关块:只保留8K上下文中最相关的块。
分离指令转换:使用单独的信息指令来区分用户查询中的指令和非指令部分。例如,将查询"你应该用2,000个词回答,尽可能详细。我的问题是自行车是什么时候发明的?"转换为提示结构。
关键词提取:模型能够从查询的信息部分推断出多语言关键词。
检索相关块:使用BM25算法,这是一种传统的基于关键词的检索方法,来找到最相关的块。

这种RAG方法速度很快,但如果相关块与查询中的关键词不匹配,就可能被忽略。

逐块阅读

代理构建的第二层是"逐块阅读"方法。研究人员发现,初始的RAG(检索增强生成)方法非常快,但如果相关块与查询中的关键词不匹配,就可能被忽略。为了解决这个问题,他们引入了一种更加蛮力的策略,分为三个步骤:

评估相关性:一个模型检查每个512令牌的块是否与查询相关。
块检索:使用BM25算法,将查询中的相关句子用于检索8K上下文内最相关的块。
答案生成:最终答案是基于检索到的上下文生成的,类似于RAG方法。

这种逐块阅读方法更彻底地确保不会遗漏相关信息,即使它们与查询中的确切关键词不匹配。通过单独检查每个块并检索最相关的块,代理可以建立更全面的上下文理解,从而生成高质量的答案。

使用工具调用智能体的分步推理

在权代理框架中,逐步推理方法用于解决基于文档的问答挑战,模型需要进行多跳推理才能得出正确答案。

这种方法的关键方面包括:

多种工具代理:该框架利用多个专门的工具代理,如"向LV3代理提问"、"子问题"、"更新记忆"等。这些代理可以被调用来执行特定的推理步骤。
迭代推理:代理从初始问题开始,将其分解为子问题。然后调用适当的工具代理来收集必要的信息,更新内部记忆,最后生成答案。
上下文扩展:通过利用工具代理,代理能够将上下文扩展到超出初始8K令牌限制,从而能够处理需要来自更大文档语料库的信息的问题。

这种逐步推理方法使权代理能够解决复杂的多跳问题,这对传统的检索增强生成模型来说是一个挑战。能够调用专门的工具并进行迭代推理,使代理能够分解问题,收集相关信息,并得出更准确和全面的答案。

实验和性能改进

权代理框架已经展示了处理长上下文输入复杂任务的出色能力。通过一系列实验,开发人员展示了这个新的代理框架所取得的显著性能改进。

一个关键进步是将大型语言模型从8K上下文大小推广到百万令牌上下文。这是通过利用权代理的多层方法实现的,包括检索增强生成、逐块阅读和逐步推理。

实验表明,权代理可以在各种功能上超越传统的RAG(检索增强生成)算法和原生长上下文模型。这包括生成响应的质量、理解和推理长篇文档的能力,以及在基于文档的问答任务上的整体性能。

此外,权代理被用于为新的长上下文权模型生成高质量的训练数据,进一步增强了底层语言模型的功能。利用代理框架合成微调数据的这种方法已被证明是推进大型语言模型最新技术水平的有价值策略。

权代理性能的详细结果和比较可以在附带的博客文章中找到,该文章链接在下面的描述中。这个资源提供了更深入的技术细节和这个新代理框架所取得的具体改进。

总的来说,权代理代表了多代理系统领域以及它们处理复杂、长篇任务能力的重大进步。对于有兴趣探索这个框架功能的开发人员和研究人员,我们鼓励他们参考提供的资源和教程开始使用。

开始使用 Quin 智能体

嘿,大家好,欢迎回到AI世界的另一个YouTube视频。在今天的视频中,我们将看一看权代理,这是一个建立在权2大型语言模型之上的新框架。这个框架集成了函数调用、代码解释器、检索增强生成以及Chrome扩展等先进功能。

要开始使用权代理,你首先需要访问Pi网站,我会在下面的描述中留下链接。从那里,你可以将代理框架安装到你的桌面上。一旦安装完成,你就可以开始准备模型服务并使用他们提供的教程部署你自己的代理。

权代理的一个关键特点是它能够利用新的权2模型,这就是本视频的目的。这个新模型非常强大,被认为是最好的开源AI代理框架。它能很好地处理复杂任务,最令人印象深刻的是,他们能够将大型语言模型从8K上下文推广到百万令牌,超越了RAG和原生长上下文模型的性能。

要开始使用新的权2模型,你可以遵循Pi网站上的教程。他们有很多很棒的资源,展示了你可以用这个新框架做些什么。我强烈建议你去看看,因为它在AI代理开发领域是一个游戏规则改变者。

所以,如果你对探索权代理和新的权2模型的功能感兴趣,一定要访问Pi网站,安装框架,开始实验。这是一个强大的工具,可以帮助你创造出能够轻松应对复杂任务的复杂AI代理。

常问问题

什么是Qwen-Agent?

Qwen-Agent的关键功能是什么?

Qwen-Agent如何实现处理100万个令牌上下文的能力?

Qwen-Agent框架中有哪些不同的复杂性级别?

如何开始使用Qwen-Agent?