• 首页 > 企业IT频道 > 人工智能

    中国式ChatGPT样本:未来智能公司商业远图

    2023年03月01日 09:55:49   来源:前瞻网

      AI 再次看到了实现商业化价值的曙光。

      这次,借助 OpenAI 团队的 AI 梦想结晶,现象级产品 "ChatGPT",AI 应用火出天际。

      但是,就目前而言,ChatGPT 和之前的 AI 产品一样,仍未随之出现可见的商业化模式。

      既出人意料而又无意外,这看上去矛盾。但多年的实践证明,作为技术应用大国,中国对原创技术的商业化应用探索,常能领先。如今,这对矛盾又一次在类 ChatGPT 商业化价值探索领域,闪耀着这抹中国色彩。

      来自中国合肥的 AI 创业公司——未来智能,开发的会议办公耳机 iFLYBUDS 系列,即为类 ChatGPT 平台商业化做多年努力的结果呈现,也是为之实现商业价值的生态系统,提供垂直场景数据和训练迭代的智能终端。

      多年的原创技术和应用大势都曾经或仍在证明:共建才能产生真正的商业繁荣,而共建法则,即构建生态平台。从 ChatGPT 聚合的技术应用前景看,ChatGPT 具备生态特征。

      生态需要何种应用技术?未来智能的会议耳机这种 AI 终端有哪些功能,和 ChatGPT 有什么关系?如何实现商业化?

      老问题:ChatGPT 为何在美问世

      从 AI 技术发展路径看,ChatGPT 并非新技术成果。在理论上,ChatGPT 没有更多创建——核心技术在 2017 年就已出现。

      这次为很么能大火?" 因为面向公众开放。" 未来智能 CEO 马啸对华尔街见闻说," 原先 ChatGPT 做的是企业级服务,或面向大型开发者,这次对公众开放后掀起狂潮。"

      ChatGPT 问世后横扫全球,在短期内(2 个月)即积累了 1 亿用户,成为全球迄今为止达成 1 亿用户最快的技术应用工具。说这是工具,但究竟什么是 ChatGPT?

      简单说,ChatGPT 是用 Problem Models(问题模型)加上 1750 亿个参数 / 节点,以之为基础提供巨量、有监督的学习数据,借助 Transformer 架构," 投喂 " 给 AI 训练模型,做出的 AI 应用效果。

      这么解释或许过于抽象,那就换种说法。

      顾名思义,ChatGPT 中的 "Chat" 是 " 聊天 " 的意思,GPT 是什么?这是 OpenAI 公司的一个 AI 技术名词。民生证券电子行业分析师方竞在研报中写道:ChatGPT 是基于 OpenAI GPT 技术的聊天机器人,拥有 3000 亿单词的语料基础,预训练出拥有 1750 亿个参数的模型。

      由于 GPT 的技术核心 Transformer 神经网络架构在 2017 年就实现了开源——这个架构由谷歌创建,其革命性在于能让 AI" 听懂人话 " ——因此,中国 AI 领域对此也不陌生。

      但是,中国在技术领域一向有着秉持实用主义的 " 优秀 " 传统,不愿为看不见或不明确的未来持续投入资本。因此,没有人像 OpenAI 那样,持续保持大投入,通过 Transformer 架构做 AI 技术开发。

      " 大模型要烧很多钱,因为要大规模做算力分布式节点投入。" 马啸说," 所以 2017 年以来,国内都在观望。"

      从现实的角度看,国内不敢投入,也确实因为基于 Transformer 架构的 AI 技术开发成本难以承受。

      自 2017 年,Transformer 神经网络架构问世,AI 即进入大模型阶段。这什么意思?大模型有三要素,即算力、算法和数据。这三要素的相互关系是,算力的强弱,决定算法的效率,而算法又决定数据的有效性;反过来,数据是训练算法的要件,能决定 AI 学到的知识量。

      在业界,能提供高效 AI 训练的载体是英伟达的 A100 和 H100 等 AI 专用显卡。这种专用显卡与普通消费级显卡的区别在于,后者通常会将部分算力让渡于光追等功能,而前者的特点是从硬件设计到软件配套,都为 all in AI 服务。

      如此很明显,GPT 的训练效果优劣,与投入的显卡数量有关——巨额成本即源于此。

      这成本多高呢?据说有机构做了测算,训练一个 GPT-3,需要至少 1024 张 A100 显卡持续运转 30 天,而 A100 显卡最便宜的版本,价格也高达 8769 美元。也就是说,为 AI 训练做最基础的核心硬件准备,就得投入 880 万美元。

      除了最基础的高额硬件投入,ChatGPT 训练所耗费的成本才是不可承受之重。训练一次,需要 1000 万美元,要训练出一个 GPT-3,以每天训练 10 次,持续 30 天计算,需要投入 30 亿美元。

      这就是为什么国内对开发基于 Transformer 架构的 GPT 技术缺乏探索热情的原因。

      因为,成本太高!

      样本:" 未来智能 " 会议耳机

      现在,美国 OpenAI 用实力证明 GPT 技术应用的有效性。

      国内闻风而动。

      但是,出于同样的原因——实用主义——国内对新技术全部热情的考量源自 " 这种技术能不能创造出确定的应用商业价值。

      现在,ChatGPT 刚刚问世,还没出现能大规模落地的商业模式。此时,中国技术公司行动的时刻到了。

      就像在顶层话语体系中,相对于传统的西方式现代化,有中国式现代化一样(类似的相对于美国梦的中国梦),国内也会出现中国式 ChatGPT,顶层已有此方面的明确指向。

      在马啸看来,中国式 ChatGPT,可能的演进路径是数家像百度、腾讯或阿里那样的大厂负责平台搭建,之后在此平台上,必然会有 " 大量基于垂直领域的微调模型,在(中国式)ChatGPT 上做垂直领域服务 "。

      这是互联网和移动互联网技术和商业模式发展的历史路径,也很可能是 ChatGPT 在中国发展的未来方向。

      一旦国内 ChatGPT 开放 API 接口,这些做垂直领域小模型技术开发或服务的公司,就能随之接入平台,为之提供垂直细分场景的训练数据和成果,共同为中国式 ChatGPT 平台的商业繁荣添砖加瓦。

      有没有这种公司在做这种探索?

      答案:有。

      马啸领导的未来智能,已经持续开发了多年 AI 训练的终端:办公会议耳机。这种品类,立足于细分的办公会议场景,解决办公场景录音、记录、文字转化或语言翻译等多种问题,目的是帮助会议参与人提升办公效率。

      办公会议耳机的定位,也就是目标消费群体,包括城市白领、政府官员、律师、记者、外贸从业人员、跨国公司管理和券商分析师等,从中提炼符合职业标准提问的问题模板,以供后续同样场景做调用,这能大幅提升交流效率。

      在此过程中,实际上就涉及了垂直领域多种职业的特定语义标签 / 参数提炼,形成大规模的海量用户数据(库),近似于创建语义大模型。在此基础上,随着耳机目标用户的高频日常使用,相当于在做标准职业问题模板的 AI 训练。这是未来智能开发的办公会议耳机与 ChatGPT 的内在关系写照。

      举个例子,职业投资人经常跟企业开会,以更全面了解企业情况,以此为投资与否提供参考依据。一般来说,投资人会经常问些共性问题:比如企业年营收多少?有多少盈利?毛利或估值是多少?这种大量的重复性问题,可通过会议耳机的 AI 技术做标准化特性提取。

      当这种垂直职业的数据积累得越多,会议耳机能提取的信息就越精准。通过高效问题模型训练,就会有极大的机会涌现出非常有价值的服务。随后,再通过这种优质服务,带动耳机或其他可能的硬件端的销售,以此形成商业闭环,这就是技术和服务双轮驱动。

      目前,未来智能的办公会议耳机已迭代到第四代,共四种类型。2022 年,会议耳机出货量同比实现 10 倍增长。到 2024 年,未来智能办公会议耳机销量将超过百万台。

      更重要的是,这种耳机的 AI 特性,未来智能的存量或增量耳机都在平时的高频应用中,持续为未来智能的双轮驱动闭环提供动力。

      这就是中国式 ChatGPT 平台商业应用的实际发展和可见的商业价值路径。更重要的是,这一路径经过实践被证明是切实有效的。

      核心价值:推动生态共建

      要明晰未来智能会议耳机的商业价值,这也是中国式 ChatGPT 在垂直领域商业化可能的样本。对于这样的样本,像建立在生成类问题模型基础上的 ChatGPT 技术应用,同类技术原理的会议耳机,AI 技术的生成性如何形成?

      华尔街见闻了解到,未来智能当前推出的办公会议耳机,自带的软件系统能实现自动学习。这种学习结果,能在又一次的基于语言发音生成的语义文本过程中,按照用户的发音习惯更新自动学习的准确率。由此形成数据训练效果循环迭代。

      在用户语音和会议耳机 " 记录翻译 " 做 " 沟通 ",也就是 AI" 听懂人话 " 时,这种会议耳机的 " 智能 " 在一开始,做不到精准理解和文本的准确记录。未来智能设计了一套询问最终文本是不是符合用户理想的系统,以解决这个问题。

      如果用户认可,比如打勾,就相当于给耳机做了一次训练;如果打叉,那也是训练,相当于告诉耳机,文本结果不准确。通过这样的方式,实施多轮使用训练迭代后,耳机就会对用户的喜好,越来越理解。当再生成语音转化成文本时,会议耳机对语义的理解就会越来越接近原意。目前,iFLYBUDS 系列办公会议耳机的转写准确率已达 98%,在业内首屈一指。

      未来智能为用户设立的账号,是提升 " 人机默契 " 的核心。比如声纹识别功能,在用户使用会议耳机是,耳机会自动根据声纹特质做匹配。一旦发现是某个曾经使用过耳机的人,就自动关联该用户的沟通记录,随之形成一张该用户的社交网络数据。

      这张网将为该行为人的职业特征,提炼重复性的标准问题的标签参数,供 AI 训练模型跑数据。不同职业的共性问题参数,即形成问题模型数据库。

      从底层技术原理出发,未来智能的办公会议耳机,就是所有声音,只要经过耳机,都可被记录和处理。比如将线上或线下的会议语音转成文字,这种文字可能是英文,也可能是日文或其他语种。这要看用户需求是什么。

      如果用户想将中文会议记录转成日文,或将英文会议语音转成中文,都能通过这种耳机实现。同时,未来智能的办公会议耳机还具备强智能 AI 自动学习能力。

      事实上,华尔街见闻发现,未来智能开发的办公会议耳机,除了聚合多种 AI 应用能力,实现围绕办公场景的效率提升,更具想象力的商业前景,是其目标用户应用耳机的过程,相当于在构建一套垂直细分市场的子生态。

      若对整个过程简做要概括,即在美国推出 ChatGPT 生成式 AI 应用聊天机器人前,国内商业组织在做类似的技术应用探索。双方的区别是美方做高成本的 AI 技术验证,中方做同类 AI 技术应用的商业化探索。

      比如未来智能,这家公司多年致力于围绕办公场景的细分领域研发 AI 提效工具——办公会议耳机。自 2021 年以来至今,未来智能的会议耳机销售的存量和增量终端,在高频应用过程中,形成了领域内有商业闭环的子生态。这个子生态已运行了至少两年,而且是在推进商业落地的过程中逐步迭代。

      不难预见,一旦中国式 ChatGPT 问世,开放 API 后,未来智能的办公场景 AI 终端系统就可接入。这相当于给 ChatGPT 提供了办公场景的 AI 训练、数据和应用数据库和技术应用解决方案。

      像诸如安卓和 Windows 等平台,之所以具有超越想象的商业价值,是因为在这个平台之上,奔跑着海量的细分生态子系统。这些子系统,共同构成了繁荣的整体大生态。在共建具有高度价值超级平台的同时,子系统也在持续为其所在的垂直细分场景,持续提供源源不断的商业动力。

      这才是未来智能推出的会议耳机真正的、核心的、极具商业想象空间的价值核心,也是必将出现的中国式 ChatGPT 为世界 AI 商业化落地做出的真正贡献。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。