京东心动购物季即将开启 学而思xPad Pro PLUS会员到手不高于7899元520来京东搜“京东老友季” 听红衣教主聊AI的那些事520买礼物就选博朗亲肤6系剃须刀礼盒 京东比李佳琦便宜70元以旧换新至高减20% 京东家电家居618 “购新”更超值飞利浦蜂巢7系列京东家电家居采销直播间比李佳琦便宜155元飞利浦蜂巢7系列京东家电家居采销直播间比李佳琦便宜155元CHIMA现场|“智慧医院云文档中心”成功发布,上海CA医疗行业数字信任方案备受关注擎朗医疗携全新一代Gen 2物流机器人亮相CHCC2024,助力医院数智化建设OpenAI“宫斗”第二季?消息称“超级对齐”团队已解散,成立不到 1 年2023 年我国卫星导航与位置服务产值超 5300 亿元,同比增长 7.09%下单到收货不到一刻钟,河南开启首批低空无人机物流配送航线杭温高铁开启联调联试,建成后杭州到温州 1 小时到达上海临港发布首批数据跨境一般数据清单,涉及智能网联汽车、公募基金、生物医药 3 大领域上海:将加快开源人形机器人原型机研发,2025 年重点行业机器人密度达 500 台 / 万人618前夕淘宝升级多款商家AI工具,面向商家免费开放崛起!一文速看云计算“国家队”五大突破!消息称中国一汽将加入蔚来换电联盟IDC:今年Q1中国平板电脑出货 713 万台同比增 6.6%,华为259万台位居第一构建离产业最近的AI,腾讯云公布多项大模型产品进展谷歌Pixel 8 手机运行 ChromeOS 项目现阶段仅为概念验证
  • 首页 > 云计算频道 > 大模型

    对话百度侯震宇:大模型的成本门槛,还能怎么砍?

    2023年12月22日 12:42:02   来源:创业最前线

      上线15年,苹果应用商店的App数量达到180万个。繁荣的应用生态,直接为苹果带来的运营利润率据信超过70%。

      生成式AI的热浪涌动以来,构建一个繁荣的应用生态、成为下一个App Store甚至iOS成为众多科技巨头追求的目标。不过从目前进展来看,从基础大模型走向AI原生应用的爆发,这个过程障碍重重。

      底层IT基础设施重构、大模型使用成本、应用研发范式,环环皆门槛。

      在AI原生时代的「愤怒的小鸟」出现之前,位于变革底层的云计算产业以及云服务商应该如何自我重构、如何磨平大模型的准入门槛去加速AI原生应用生态的繁荣?面对大模型浪潮,企业客户诉求又发生了哪些变化?

      在2023百度云智大会·智算大会期间,《降噪NoNoise》对话了百度集团副总裁侯震宇。

      在国内云计算厂商中,百度智能云是最早进行大模型「适配」的一家。今年3月27日,百度智能云基于刚上线的文心一言,推出面向企业客户的千帆大模型平台;8月31日,千帆平台全面开放,近4个月内的大模型日调用量增长了10倍。

      作为百度智能云事业群云计算产研以基础技术工程团队的负责人,侯震宇向我们分享了百度智能云的最新业务布局,以及百度内部对于行业发展趋势的最新判断和思考。

      01

      降模型成本

      2024年非常关键的事

      今年以来,算力已经被公认为是大模型竞争的「军火库」。这不仅让英伟达的市值超过英特尔,也让其财报中的GPU收入超过了手机芯片之王高通。

      但算力的另一面是GPU供应紧张、价格昂贵。成本压力是会层层传导的。

      比如AWS首席执行官Adam Selipsky前不久在谈到整个行业时曾直言:「我接触过的很多客户都对运行其中一些模型的成本感到不满。」

      在这个问题上,中美企业所面临的挑战并无不同。在同《降噪NoNoise》交流时,侯震宇提到他的一个判断——预计2024年整体算力资源供应的不确定性或者说紧张程度仍然比较大,所以云计算厂商面临的共性问题是如何更高效地使用算力资源。

      其实不仅是算力资源昂贵,目前人力资源、数据资源(如数据标注),本身成本也很高。「确保大家用足够少的钱能训练出来想要的模型,以及用一个客户可接受的成本使其真的把AI大模型用起来,这些会是2024年非常关键的事。」

      目前,国内云计算厂商的思路大多是在保证同等效果前提下,通过推理优化、模型训练工具链优化等,以缩短算力使用时间。

      以百度智能云为例,其主要通过基础设施层的异构计算平台「百舸」、大模型平台层的「千帆」互相打配合,以实现算力性价比。

      追求算力性价比的方向无非两个:一是提高GPU利用率,缩短使用时间。比如在大模型训练环节,百度通过分布式并行训练策略和微秒级互联,让万卡规模集群训练的加速比达到95%、万卡集群有效训练时间占比达到98%。

      「百舸」升级到3.0版本后,训练和推理场景的吞吐量据称可提高30%-60%,这些意味着原来要用100天的训练,现在可能只用70天,节约时间等于间接省钱。

      二是适配成本更低的AI芯片,除英伟达外,千帆平台还兼容昆仑芯、昇腾、海光DCU、英特尔等国内外主流AI芯片。毕竟不是所有训练都需要动用H800这种顶格待遇。

      通过组合选项,理论上客户可以用最小的切换成本完成算力适配。这种属于直接省钱。

      不过再怎么省钱,前提还是要保证AI模型的效果。若达不到客户的预期效果,云服务商对算力资源「算计」再多,也是没有意义的。

      02

      AI原生应用生态,需要先“松土”

      今年下半年以来,李彦宏在多次在公开场合奋力疾呼:别再卷基础大模型了,跑偏了,现在应该去卷AI原生应用。

      对于李彦宏所提建议,外界并不意外。AI原生应用是构建大模型生态繁荣的重中之重,也是百度等AI巨头在大模型商业变现路上的核心变量。

      未来的大模型变现,一部分将通过模型生产获取收益,更多还是通过原生应用调用模型API带来的算力消费,这部分将会是规模更大的收入来源。所以说,仅有算力未必能搞定一切,孵化生态更为重要。

      反映到百度智能云,一是千帆平台的「既要又要」——作为大模型层平台,千帆上不仅有百度「文心大模型4.0」,还先后上架了50多个第三方基础大模型和行业大模型,相当于搞了个「大模型商店」;二是「卖铲子」——为企业提供大模型开发的全流程工具链和整套环境。

      在AI原生应用层,为降低开发门槛,百度智能云宣布AI原生应用开发工作台——「千帆AppBuilder」全面开放,将开发大模型应用的常见模式、工具、流程,沉淀成一个工作台。通过上面的应用组件和应用框架,开发者、企业可以快速搭建AI原生应用。

      这就好比一名想要出租房屋的房东,他不仅要把毛坯变成精装,还要提供床、沙发等生活基本套件,最好能做到租客拎包入住,只有这样,房屋的出租、流转效率才有可能提高。

      我们从交流中获悉,百度智能云早期并没有意识到一个问题——许多开发者还不擅长使用大模型做应用开发。

      他们访问了一批开发者,想要知道当这些人想到了一个检索增强的框架、希望用一个Agent的时候,自己知不知道一个Agent该怎么搭建?

      结果发现,很多人真的以为只用大模型Prompt接口,就可以完成应用开发。

      这也说明,要构建一个百万级的原生应用生态,平台需要率先为开发者松松「土壤」、扫除各种障碍,而不是等后者直接被研发新范式「劝退」。

      毕竟开发者是应用爆发的主要推动力量。

      「如果没有应用调用,意味着你做出来这个模型效果不够好或者大家用不起,意味着这个产业就有问题。」侯震宇提醒,只有行业客户的场景里有更多的AI原生应用落地,构建出新的应用生态,才能真正实现大模型的价值。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    中兴二合一 5G 云电脑“逍遥”系列上架:一键切换双模式,

    5 月 10 日消息,据中兴通讯官微,中兴二合一 5G 云电脑“逍遥”系列已经在电商平台上架。其支持本地、云端双模式,可在电脑与平板模式之间一键切换。售价方面,型号为 W200DS 的产品首销价格为 1899 元。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。