• 首页 > 企业IT频道 > 人工智能

    昆仑万维「天工」大模型开启内测,我们跟它聊了聊理想

    2023年04月27日 09:05:47   来源:蓝媒汇

      “每隔一段时间,就会有一个革命性的产品出现,然后改变一切。”

      这是2007年1月9日,乔布斯在一次手机发布会上的开场白。手机名叫iPhone,它改变了通讯、娱乐和移动互联网。之后,iPhone或是和iPhone类似的手机,出现每个人的手中。

      2022年11月30日,由OpenAI研发的ChatGPT问世。

      在最初的描述中,ChatGPT被称为“聊天机器人程序”,但人们发现这个AI能做的不只是“Chat”——之后的几个月,人们陆陆续续将它接入各种场景:答疑、编程、绘画、翻译、文本创作、广告设计、头脑风暴……然后震惊于AIGC的想象力、创造力和生产效率。从聊天到创作,或许在2023年之后,没有任何一个行业有理由完全排除AIGC。

      此时此刻,恰如彼时彼刻。

      但也有不同——这一次,国内AI行业的跟进远比过去及时。百度、商汤等几位AI课代表很快推出了类似ChatGPT国产AI大模型,外界的质疑声中渐渐听到了掌声。

      2023年4月,昆仑万维「天工」3.5大语言模型发布,并启动邀请测试。AI蓝媒汇(ID:lanmeih001)的蓝媒君第一时间对话了「天工」大模型。

      对话的内容,都和“理想”有关:

      AI大模型没说自己的理想,但它鼓励蓝媒君坚持理想——“记得不要因为挫伤自尊心而放弃。”

      昆仑万维的理想——“目前版本我们对标的主要是OpenAI的ChatGPT。未来让它尽快达到GPT4的能力。”

      国产ChatGPT,能再迎一次惊喜吗?

      第一个实现“智能涌现”的国产大模型

      在和「天工」大模型的对话中,蓝媒君预设了一个场景:中学老师与学生对话,目的是确定学生的兴趣。

      蓝媒君确实曾和体育场里面的小朋友聊过这个问题,当时小朋友的回答是“喜欢跑步”、“觉得好玩”。

      尽管在一开始就预设了问答模式,但「天工」大模型在实际对话中并没有完全遵循“每答必问”的结构——或许是算法判定蓝媒君“喜欢踢足球”这个话题已经讨论充分,可以作为“你的兴趣是什么”的答案。

      蓝媒君提出了第二个兴趣,看书。

      从这里可以看出,「天工」大模型依然延续着刚才关于“确定兴趣”的这个话题,并遵循了问答结构。

      对话继续,蓝媒君的爱好很多。

      「天工」大模型所给出的反馈始终直白,像是两位小朋友最日常的对话:你喜欢科学,那你会怎么做?

      以上文本在成年人看来略显简单,但一问一答确实符合需求——「天工」的回答做到了逻辑通顺、推进沟通。而这种简单通顺,或许正是人们需要的。

      或许整场对话难言十分惊喜,但至少从对话逻辑和内容上,「天工」基本做到了连贯通顺、符合人类逻辑。

      在谈到大模型的逻辑推理时,昆仑万维称,「天工」目前的记忆力大约可支持20轮次以上的交互式问答,文本容量也在万字以上。

      “在AI领域,进行自主学习并完成逻辑推理等任务的能力,被称为‘涌现’能力。”而根据昆仑万维CEO方汉的介绍,「天工」大模型是目前“国内第一个实现智能涌现”的国产大语言模型。

      这是一个在相对简单的系统中,由量变产生质变,最终产生复杂的行为或特性的过程。

      而根据官方提供的测试数据,基于千亿基座模型和千亿排序模型,「天工」大模型生成内容已经能够在某知识社区的问答中,获得KOL级的赞同和回应。

      但「天工」偶尔也有失误的时候。

      在另一份关于数学题的测试中,天宫大模型准确算出了一道鸡兔同笼题目,但却被另一道来自中学数学课本的一元一次方程困住,并最终得出了一个错误的计算结果。

      或许是对题干的理解偏差,或许是方程组相关的数据训练还不够完善,「天工」在运算方面的能力和方法,仍有些改进空间。

      谈及大模型训练的工程进度,昆仑万维方面表示,关于数据的筛选、剪枝和清洗是“长期主义”的过程——「天工」大模型将在后续的迭代中,通过筛选数据调整参数改进模型设计。

      “问题会有,但正视差距不会影响团队的信心。”

      而「天工」大模型,也只是昆仑万维在AIGC赛道内的落脚点之一。

      合作破局

      和大模型同期公布的,还有昆仑万维同阿里云的AI合作项目。

      4月11日的阿里云峰会上,昆仑万维与阿里云共同发布了包括智算中心建设、大模型训练等领域战略合作。

      这并非是两家公司首度牵线——2015年到2020年间,昆仑游戏、闲徕互娱,OPay海外支付业务已经相继接入了阿里云业务。

      两家公司在AI领域的合作则稍晚一些。2021年,昆仑万维开始规划自建大语言模型之后,于2022年2月敲定第一批AI算力集群的项目合作。

      项目的合作方,正是阿里云:“当时合作主要是依托阿里那边的高性能AI计算集群,进行大规模语言模型预训练工作。”训练内容囊括了算法与架构的协同、计算流水线与架构的协同、最优化存储、TCO优化四个方面。

      双方此番合作,目标是则是要进一步盘活国内AIGC生态——不只是大厂背书,还有技术合作。

      昆仑万维方面表示,随着「天工」训练规模的扩大,模型参数逐渐接近万亿规模,“单个训练任务需要5000张以上A100(GPU芯片),这样大规模的GPU集群下,通信会产生大量的拥塞,训练效率会越来越低,对存储读写性能同样是个挑战。”

      而阿里云所提供的,则是业内最领先的算力平台。“后续昆仑万维的AIGC业务,预计会有阿里云的灵骏底座+PAI软件平台加持。”

      AI蓝媒汇曾在《黄仁勋,ChatGPT时代的第一位赢家》一文中提及,国内AIGC项目始终绕不开算力和成本的阻力,昆仑万维CEO方汉也表示,在目前的大模型训练中,购买或者租赁英伟达的A100系列GPU仍占据了不少开销。

      “资源是一张门票。大模型训练的门槛就是几千张GPU芯片。而在芯片到齐之后,接下来还要拼工程经验——实验的速度,人才的厚度。”

      围绕ChatGPT开展的AIGC项目,在变现之前仍需付出。

      按照计划,在2023年的6、7月份,阿里云会为昆仑万维打造一个专属的、支持万卡扩展的AI算力集群。

      “我们期望与阿里云展开深入合作,激活国内AIGC技术生态,为中小企业和开发者的创新提供便利。我们一直觉得,当产品的能力足够好、真正能够帮助用户解决刚需,那么获得经济回报就是水到渠成的事。”

      而现阶段昆仑万维的业务重心,则仍在研发和训练领域:“潜下⼼认真打磨产品,帮助模型进化到更高水平,让它尽快达到GPT4的能力。”

      可以预见的是,在未来一段时间内,包括昆仑万维在内的国内AI玩家,仍将面对GPU资源量方面的阻力,仍将是赛道内的追赶者。

      至于何时追近,能否比肩,AIGC的从业者同样需要市场和时间来解答

      来源|AI蓝媒汇 作者|伊柒

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    中兴二合一 5G 云电脑“逍遥”系列上架:一键切换双模式,

    5 月 10 日消息,据中兴通讯官微,中兴二合一 5G 云电脑“逍遥”系列已经在电商平台上架。其支持本地、云端双模式,可在电脑与平板模式之间一键切换。售价方面,型号为 W200DS 的产品首销价格为 1899 元。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。