随着LLM能力的进化与行业标准化体系的建立,2025年已然成为AI Agent从概念验证到规模落地的关键转折点,也是AI Agent规模化落地的关键一年,AI Agent正在改变企业的生产方式和交互模式,它不仅是技术的突破,更是企业战略升级的关键。企业应优先在高频、规则明确、数据丰富的场景试点AI Agent,逐步积累经验,最终实现全链条智能化升级。
一、大模型的知识处理能力
01新技术的使能效应
大模型是AI历史的突变和涌现,从1956年达特茅斯学院的人工智能会议算起,人工智能历史已接近70年。在机器学习中,模型作为核心概念,本质是对函数映射的描述何抽象,通过对模型进行训练何优化,可以得到更加准确和有效的函数映射。建立模型的目的,是从数据中找到一些规律和模式,用这些规律和模式,预测未来的结果。模型的复杂度越高,模型越容易过拟合。模型参数越多,意味着该模型可以处理更复杂、更丰富的信息,具有更高的准确性和表现力。因此,超大模型的训练和调整需要极其巨大的计算资源和数据量级、更加复杂的算法和技术、大规模的投入和协作。
无论是在手工时代,还是工业革命时期,新的技术突破,也会带来全新的产品和服务。19世纪30年代修建的蒸汽机车和铁路;20世纪10年代的汽车和公路建设;21世纪10年代的智能手机和移动互联网服务,都是巨大的新市场和蛋糕。重要的是,新的产品同样会促进其他行业产品的流通。新岗位的就业数量与市场规模成正比,新技术要打开新市场,才能源源不断的增加岗位,来解决旧岗位被技术替代解决的失业问题。工业革命是在1840年后进入的良性循环,1850年工厂发挥规模经济优势,刺激蒸汽机的应用,催生密集型的新岗位。新技术的使能效应过程中,呈现了两个关键特征,分别是生产体系和人力教育对技术的主动适应性。
回顾几次工业革命,技术对生产率的跨越提升,均需要生产流程围绕新技术进行重构。
大模型可以作为私人助手,帮人们高效完成工作,也可以自主平等协作,完成不同级别的业务流程。
02数字时代的智能基座:预训练模型;算法皇冠上的明珠:生成式模型
当我们拥有了高质量数据和算力后,算法可加深解析数据,能够精准定位关键信息并生成决策方案,减少算力消耗,优化资源利用,通过迁移学习等技术,将已有知识迁移到新任务中,能减少训练时间和计算资源消耗,驱动算力发展效率。三者协同作用,共同推动AI技术进步。
预训练模型:预训练在算法大模型领域是革命性的技术范式,核心价值在于自监督学习海量数据知识,可为下游提供强大的基础能力。若将预训练比喻为神经网络模型的练习题,在预训练期间,模型会根据预测结果进行反向传播,调整模型参数来提高模型的准确性。这个过程很像做练习题,每次的训练都可以让模型更好的掌握语言知识和技能,提高下一次预测的准确性。
企业在训练神经网络模型中,都将对模型进行参数优化,让模型在预测任务中表现准确,这样的反向传播,利用误差信号来更新模型参数,以便让模型更好的拟合训练数据。同时,利用梯度下降算法更新模型参数,对参数进行微调,减少误差,提高模型预测准确性。反向传播与算法梯度下降的迭代,不断调整参数,提高模型在预训练上的表现,为模型的预测任务提供准确结果。对比传统方式,预训练将重构AI开发范式,统一基础模型+微调、调用API、小时级部署,开发成本降低10倍以上。
整个过程是深度学习、神经网络模型学习和优化的关键,核心机制为突破数据标注瓶颈、实现通用能力迁移、构建压缩理解生成表征能力、涌现复杂推理能力(参数超千亿,模型将突破0样本学习、复杂推理)等。它是一个技术杠杆,将技术迁移通用智能化,是AI工业化的基础、可降低AI边际成本,支撑AGI核心底座。
生成式模型:生成式模型是算法领域的革新突破,AI感知到认知的跃迁,不止是“生成逼真内容”,它是一种对数据本质和世界规律进行深度理解和建模的能力。它的目标是建模逼真真实数据的复杂概率分布,成功生成,意味着模型真正捕获了数据的关键特征、变量间的依赖关系、数据生成的底层物理和语义规则。最大的价值就是全新、符合特定分布的、被约束的特定样本(图形、音频、文本、代码、视频、分子结构等)。打破不同数据类型的壁垒,还可创造出跨模态生成。
生成式模型赋予算法革新,提升判别模型能力、推动模型可解释性、促进多模态融合,也是实现跨模态理解和转换的核心技术,进一步加速认知能力的“统一智能体”发展。
可见,投资算法是提升数据资产价值和最大化算力投资回报率的关键战略。理解算法在推动数据、算力发展的作用,对于构建高效、可持续的AI基础设施至关重要。
二、大模型产业解析
01大模型优化的GPU和云服务
在大模型进行商业化后,推理成本将成为业务边际成本的重要部分,需要对推理业务在GPU上进行加速优化,从而降低成本。这也代表企业需要更大的显存容量、更快的显存带宽、更高效的集群通信能力。大模型供应商进行预训练和微调时,需要GPU,行业用户应用时,利用私域数据进行模型微调时,需要GPU,最终应用时,还需要GPU进行推理。
在算力、数据、算法的三要素中,大模型产业通过硬件基础+分布式框架,重点解决算力问题后,数据的数量与质量,便成了大模型训练的性能影响因素。预训练中,数据常常可通过购买、合作、抓取等方式,并进行数据清洗,无需人工标注。但,进入后阶段,RL与微调时,都需要人工标注和样本数据,这些数据获取,一方面是专业人士数据标注,以及采购专业数据公司和云厂商数据服务;另一方面是获取合规性的公域或三方数据、接入企业私域数据;最后是搜索用户使用过程中的反馈,这些数据加入训练,大模型的性能和使用体验,将得到极大提高,也将启动数据飞轮,走向自我强化的循环。
-------------------------------
除了模型参数比拼,智能体正在定义人机协作边界
落地实践中,算力资源的高需求与技术难题相互交织、双重凸显。其中,Agent架构相较于传统AI产品呈现出更为突出的算力消耗特征--单次任务处理所需的Token数量可飙升至十万量级,这一现象主要归因于其对长上下文的理解分析、多Agent间的交互通信机制、复杂的验证流程以及多模态融合应用场景的综合需求。以Manus平台为例,其依托Claude 3.7 Sonnet模型执行单次任务时,不仅产生超过10万个Token的数据交互量,更伴随约2美元的成本支出。
从技术维度审视,该领域正面临三大核心挑战:自然语言的模糊性引发的语义意图误判问题、多智能体协作中存在的群体思维趋同与利益分配失衡现象,以及模型生成内容可能出现的事实性错误(即“幻觉”效应)。针对这些瓶颈,学术界积极探索贝叶斯统计实验设计与分层式系统架构等创新路径进行优化;而在产业界,则普遍采用RAG(检索增强生成)技术方案来有效抑制幻觉现象,典型如医疗健康领域通过整合专业知识库显著提升了辅助诊断系统的精准度。
02模型即服务层(MAAS)
大模型的产业核心是MAAS层,我们现在使用的大模型应用均是这一层模型,通过企业服务模块的应用程序接口形式,实现对话、写作、分析、写代码等各种功能。面向应用开发者多功能调用,包括模型推理、微调训练、强化学习训练、插件库、私域模型托管等。
被开发者常应用的是开源模型,其源代码、模型数据、模型训练过程内容,均公开可用,不同的开源模型,可规定不同的内容开放范围和使用场景,不一定百分百开放。对比闭源模型,闭源模型商业化程度高,产品完善、模型性能更佳。开源模型可以降低模型的二次开发门槛,充分利用AI大厂预训练计算集群,规避算法调优、无需清洗庞大数据,有助于领域应用的广泛应用和普及,开发者以及社区驱动了开源模型的创新和改进,群体智慧更快的发展(Meta LLaMA等扩展出来的模型成为了生成式预训练的典范).
LLM需创造价值,若应用层无法实现商业价值和客户价值,整个大模型将失去持续发展的动力。面向服务,LLM最基础的能力便是模型推理,微调训练(帮助企业适应特定任务和领域、定制应用)、强化学习、模型裁剪(帮助企业特定场景的规模化部署)、私域模型托管、插件库(帮助企业获得最新、最私密、少有的训练数据、执行指定操作等)。应用层拥有良好的创新和价值,为各行各业将带来智能业务场景上的诸多可能。
三、大模型应用与行业结合,提高现有生产力,是最落地的商业
新技术的引入和发展,势必带来新的产品与服务形态。由于大模型具有跨行业的通用性,通过自然语言、API系统对接交互手段,支持多样化的使用方式。因此千行百业落地大模型应用时,会因适应场景能力、成熟度、企业应用时间、企业性质的不同,经历不同阶段。
第一阶段:帮助员工提高工作效率和质量。大模型的产出归属于个人,员工也需为大模型产出质量负责。为企业探索大模型业务场景的应用成熟度、效率提升、模型缺陷、负面影响等,用于评估大模型价值,整合体系,为企业的进一步决策提供价值参考。
企业需注意的是,内部核心数据的保密,选择大模型服务商提供的私域专有模型,部署专用服务器,确保内部数据不进入公域大模型训练数据集中。此时AI:人类=1:1
第二阶段:面临业务流程调整和组织变革。大模型嵌入到了企业业务流程中,独立承担工作职责,可贡献全局性的利益,产出归属与企业。LLM与人工形成协作关系,同时可接受监督和指导。
需注意的是,要充分利用模型能力,调整和优化自身流程,关注大模型对员工的影响,调整业务流程和职能岗位,设置好组织机制。为进一步加大效果和产出,还可借助插件完成二次开发、读取、查询本地数据;包括模型微调训练、上下文学习、定制化、评估业务环节的信息量和容错率。因地制宜,评估业务各个环节大模型应用成熟度和优先级。
第三阶段:少量企业有能力尝试的阶段,让大模型的多模态能力充分释放,结合企业的全新业务模型设计产生颠覆性创新,重新设计业务,从根本上改变业务运作方式。这也将让企业的AI能力更上一层楼。
企业需从技术、产品到市场、商业进行全盘策划,创建新的商业模式,它也是大模型产业应当追求的方向。
四、大模型时代的演进产物:企业级AI Agent 的核心能力与应用场景
大模型的能力持续进化,行业标准化体系的逐步建立完善。2025年将成为AI Agent实现从概念验证迈向规模落地的重要转折点,更是其开启规模化应用征程的关键年份。当下,AI Agent正以前所未有的态势重塑着企业的生产方式与交互模式,这一变革绝非单纯的技术层面突破,而是关乎企业战略全面升级的核心驱动力。可以预见,未来,Agent或成为企业数字化转型的核心工具,驱动AI产业链从模型层向应用层延伸,重点关注具备数据、场景和平台能力的企业。
在AI Agent的开发与应用进程中,务必紧密贴合企业的真实需求。具体而言,可通过精心搭建知识库体系、持续优化上下文工程策略以及科学规划工具集成方案等举措,打造出高效且稳定的智能体应用场景。对于企业级AI Agent而言,其价值不仅体现在显著提升工作效率方面,更能依托数据驱动的精准决策支持,助力企业顺利完成智能化转型。伴随相关技术的日益精进与成熟,AI Agent必将跃升为企业数字化转型的核心动力引擎,引领企业突破传统管理模式的桎梏,推动企业从传统的管理模式向智能化、自动化的方向发展。
五、AI Agent的未来展望与市场格局
在当下的AI Agent市场中,竞争格局呈现出明显的两极态势。一方面,科技巨头依托自身在模型研发、算力储备、数据资源以及生态构建等方面的显著优势,积极谋划打造统一的平台级解决方案;而另一方面,众多创业公司与行业专家聚焦于特定的应用场景,借助垂直领域的深度应用开发、交互模式的创新探索以及成本效益的持续优化等策略,努力探寻市场的突破契机。展望未来,AI Agent的发展路径将着重围绕多个关键维度展开,诸如成本结构的精细化与效率水平的提升、通用型应用与垂直细分领域的有机平衡、交互范式的革新演进、数据资产的积累与竞争壁垒的构筑,以及人才资源的激烈角逐等。
我们看到大模型从单一工具演变为驱动千行百业转型升级的核心引擎。作为大模型落地应用的重要载体,AI Agent正在重构人机协作模式,引领AI从“被动响应”迈向“主动服务”,成为产业创新的强劲动力。国内企业将持续深化企业级AI Agent的核心能力,引领业界开启智能业务的“主动服务”新时代,赋能全产业实现技术革新!
由百林哲主办,第九届CSDI中国软件研发创新科技峰会,于9月12-14日即将在深圳隆重召开。大会以“ 数算+智跃“为主旨,旨在深入展示AI领域最新技术与应用趋势, 诠释中国企业,创新先锋的深度应用,融合业界领先的大模型、智能体技术深入在研发全方位应用领域,携手百名国内外顶尖技术专家(京东、华为、百度、阿里、腾讯、字节、亚马逊、中兴、小米、360、蚂蚁、携程、顺丰、普元......),共同研讨以LLM为核心的AI技术深入软件研发的落地实践。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
海报生成中...
海艺AI的模型系统在国际市场上广受好评,目前站内累计模型数超过80万个,涵盖写实、二次元、插画、设计、摄影、风格化图像等多类型应用场景,基本覆盖所有主流创作风格。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。