梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

以产品见长的腾讯,终于推出C端AI助手App:腾讯元宝

与之前测试的混元助手相比,元宝在AI搜索、AI总结、AI写作等核心能力上都有升级,大模型效果提升50%

功能听起来好像和同类AI助手也差不多?But,一试才发现——

精准搜到微信公众号生态优质内容(比如量子位本位~),也就腾讯自己能搞了。

这里的参考来源④,正是我们发布的Hinton揭秘Ilya成长历程:Scaling Law是他学生时代就有的直觉。

另外可以看到,提问不用特别完整,只需随口一问,元宝就能推测出你的意图,比如补全人名后再精确命中相关资料。

再来看长文本总结能力,腾讯混元大模型支持256k长文本,实际到元宝APP中表现如何呢?

比如上传一本大家喜闻乐见的《马斯克传》,界面标出了共有22.5万字,还贴心地自动填写了默认提示词。

总结效果也很完整,但是不是偷懒仅仅阅读了前言和目录呢?

选择全书中间靠后一点的一个细节提问,这是大模型“大海捞针”测试中最容易出错的地方了。

对比微信阅读上的原文,掌声可以响起来了。

在发布会现场,腾讯云副总裁、腾讯混元大模型负责人刘煜宏透露,结合微信公众号还只是第一步,未来将继续链接、整合腾讯更多生态。

除此之外,在我们短暂的试用过程中,还有更多细节值得分享。

模型能力到位,玩法多样

腾讯元宝APP背后是腾讯混元大模型,也自然继承了混元大模型的很多特色。

比如给它一个简单的数学计算任务,就可以发现AI在分析思路时非常流畅,但最后给出结果前却稍有停顿

这并不符合大模型预测下一个token的运作原理,反倒像是真的在计算。

背后其实是AI先写了一段代码,在后端执行再返回结果。

不得不说,这是一种解决大模型计算不准确问题的巧妙思路。

又比如指令跟随能力,提出各种各样复杂的结构化长指令,元宝都能按要求执行。

24点游戏对于大模型来说并不简单,需要编写复杂的思考框架提示词来指引。

但AI助手如果不能准确跟随指令,那提示词写的再完善也没用。

(为了方便展示长内容,我们切换到网页版来操作,聊天记录和APP是互通的。)

元宝在做计划这块,思考的确实很周到全面了。

执行计划时虽然绕了点弯路,但最终还是确保得到了正确答案。

除了语言模型之外,多模态识图能力也是到位了。

混元大模型基础能力够强,元宝上更多丰富的玩法才能更实用。

除了工作场景最核心的AI搜索、AI总结、AI写作三大能力之外,元宝还针对生活娱乐场景提供了多个特色AI应用,并新增了创建个人智能体等玩法。

智能体可以是让AI扮演特定角色陪你聊天,也可以是擅长完成特定任务的专家。

更方便的是,智能体在手机端就可以轻松创建

但其实腾讯在智能体上还有更大的布局:一站式智能体创作与分发平台腾讯元器。

打开元器平台,我们刚刚在元宝上用手机创建的智能体,已经同步了过来。

在这里就可以给智能体添加插件、知识库、工作流等更多模块,完成更复杂的任务。

元器平台现在也走出内测正式全量开放,更多智能体创新玩法大家挖掘了。

最后,元宝已在App、小程序和网页端上线,App可以在各大应用商店下载。

腾讯元宝网页版:

https://yuanbao.tencent.com

— 完 —

量子位 QbitAI · 头条号签约

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com