
允中 发自 凹非寺量子位 | 公众号 QbitAI米兰体育官网
在大模子的多种应用形态中,施行专科功能的行业Agent,无疑是升迁出产效力、达成价值创造的利器。
但是,千行百业包含着大宗的私域学问、众人教诲和用具使用逻辑,使得智能体的行业应用构建存在各样门槛。
为了升迁配置效力,业界提议了诸如Skills、OpenClaw等优秀的工程框架,使得专科Agent的配置门槛日益缩短,也让针对Agent应用的多维度算法优化需求愈发突显。
在此配景,诺亚方舟实验室近期在官网更新了面向行业应用的算法包MindScale,这一形状交融了实验室的算法鼎新基因与华为行业智能化业求本质教诲。
其系统性梳理了Agent时间将“大模子”转动为“出产力”的算法时刻挑战,并给出了对应的时刻论文昇腾代码达成,为行业用户与配置者提供了径直的“上手指南”。

制约行业Agent发展的四大中枢挑战
在MindScale形状中,权衡东谈主员识别了在行业普及Agent应用的四大挑战:
使命流手工治疗:依赖众人将业务法律解说“翻译”为Agent使命流;历史学问复用难:历史推理旅途与反馈无法有用使Agent系统自演进;训推效力瓶颈:大宗模子部署与迭代需求+念念考旅途变长,资本压力陡升;复杂推理测评:多步、多用具交汇推理,单精度野心无法准确响应模子成果。达成使命流自进化与教唆词自动化闭环
为了支吾这些挑战,诺亚的权衡东谈主员与多所协作单元一起,给出了我方的科罚决议。
举例,面向行业Agent配置中最常见的使命流(Workflow)配置场景,算法包中包含了自进化的Agent算法EvoFabric
与手动提真金不怕火使命流高度依赖众人教诲不同,使用SOP2Workflow不错快速从当然谈话文档与历史用具库,径直生成可施行的Workflow。

为了达成这么活泼的Workflow生成,权衡东谈主员接收了基于气象图引擎内核的Agent达成,原生因循混编Agent、用具等多种图节点,因循气象的改写和分组交融处理,达成多智能体、多用具、多追思形态的深度混编,图引擎还因循DSL文献的导入与导出,达成复杂智能过程的快速复制、移动与部署。
同期,该算法框架还不错达成基于追思的演进——多轮施行时,追思模块愚弄轨迹追思,以及那时的评估截至酿成教诲优化高下文,达成Agent越用越好。
另一个真谛的功能,是让模子开动我方进行“prompt优化”
这便是古玩行的雅贿。雅贿古已有之,可谓是年代久远。倒在雅贿上官员,历朝历代,层出不穷。
刘亚生出生于江汉平原的一个小镇,家境并不贫寒。父亲替人抄录家谱,母亲爱讲古书里的忠义故事。幼年的他经常在昏黄油灯下啃《史记》,练得一手端正小楷。1933年,他考进北京大学历史系。北大的空气掺杂着激进思潮,米兰体育他听到同学们议论“救国”与“民主”,热血翻涌。一次游行后,他被捕入狱,随后在地下党营救中脱身,这段经历成了他真正靠近革命的引线。三年后,他在西安的一处秘密会议上郑重写下入党誓词,年仅二十四岁。
领先,基于前期依然先行发布的prompt在线优化算法SCOPE,配置者不错达成在每步推理之间进行prompt在线优化,通过注入萃取历史旅途中的有用信息达成教唆词的快速优化,在HLE和GAIA等agentic reasoning的场景里不错得回20%以上的精度升迁。
此外,权衡东谈主员还提议了“大模子prompt优化器”C-MOP,通过鼎新的样本录取与梯度更新政策,科罚了“文本梯度”的突破问题,达成了基于正负例反馈的prompt自动优化,确实作念到了“反馈->演进”的prompt优化闭环。
△C-MOP:交融正误双向样本感知与时序动量梯度的教唆词优化器。

榨干算力潜能并适配国产硬件生态
除了精度升迁,MindScale也扎眼面向行业场景模子的训推效力优化,举例:
其中的TrimR用一个已预教诲、指示微调的轻量考据器在线检测并截断不消中间念念路,全程无需微调大模子或考据器;配套工业级异步在线系统,适配大并发出产场景。
在MATH、AIME、GPQA等基准与多款LRM上,TrimR在简直不影响准确率的前提下,将推理时延权贵缩短,大并发场景最高可达约70%提速,达成本色应用场景中的Test Time Scaling。

此外,为了适配行业场景高并发的推理压力,MindScale还提供了新的基于KV Cache的推理决议。
与通用决议中KV Cache仅仅用来加快解码的“幕后用具”不同,权衡东谈主员提议KV-Embeddings,把KV Cache视作一种“免费附赠”的轻量默示,无需稀零打算或存储齐备隐气象,不错在链式默示推理(Chain-of-Embedding)和快慢念念考切换等关节场景中,基于多款主流模子上达成性能握平或反超专用embedding模子,同期将生成token数最高减少5.7×
这些截至标明——KV Cache不仅仅加快器,更是一块尚未被充分愚弄的“念念考缓存”,为大模子推理阶段的默示复用掀开了新的联想空间。
此外,诺亚方舟实验室与关系协作团队还在职务追思、Agentic RAG、通用算法发现框架等多个方进取,千里淀了大宗经过实战磨砺的、围绕行业智能优化的鼎新算法时刻架构。
同期,MindScale还也包含了适配昇腾硬件的代码达成,不错让行业配置的小伙伴们,基于国产算力达成高精度、高效的Agent构建。
https://noah-mindscale.github.io/华为诺亚方舟实验室主页:https://www.noahlab.com.hk/#/home

备案号: