在AI技术迅猛发展的今天,作为数据存储与处理核心载体的数据库,正经历一场深刻的变革,传统数据库与AI技术的碰撞融合,带来了新的发展机遇,也在重塑行业的发展格局。
如何因应AI时代的变革?怎么把握机遇?达梦数据作为国内数据库领域的重要参与者,其在这一变革浪潮中的探索与实践,为我们呈现了数据库厂商应对时代挑战的鲜活样本。在DTCC2025中国数据库技术大会上,武汉达梦数据技术有限公司副总经理李庄庄向我们分享了他的观察思考与实践。
图丨达梦技术副总经理李庄庄现场演讲
AI时代数据库的挑战和机遇
近些年,文本、图像、音视频、时序等多模态数据海量增长,报告显示,企业里80%以上的数据都是这些非结构化数据,但是长期以来,这些非结构化数据难以被企业有效利用起来。AI的发展为数据释放价值带来了更广泛的新应用场景,也对数据底座提出了新的要求。
比如,AI模型训练对这些非结构化数据的依赖日益加深,需要能够高效处理这些多模态数据。而随着AI技术深入应用,在如今的后训练时代,AI应用场景中推理过程的高并发、低延迟需求,也对数据库也提出了极致的要求,数据库作为一项历经多年发展的“老技术”,在AI时代被赋予了新的使命。
“通常来看,多模数据处理、实时高吞吐处理和智能化原生适配是AI时代数据库的核心能力要求。”李庄庄说。
李庄庄认为,对AI时代的数据库来说,挑战和机遇并存。对于传统数据库企业而言,AI 时代带来了两重挑战。一方面,海量多模态数据的处理需要突破大数据量下的性能瓶颈,这要求企业在新型硬件适配和底层内核优化上实现技术突破;另一方面,数据库的管理运维复杂度居高不下,传统依赖人工的方式难以满足AI场景的高效需求,提升数据库的智能化程度成为当务之急。
图丨达梦技术副总经理李庄庄(右) IT168数据库频道主编任朝阳(左)
挑战背后,是行业发展的广阔机遇。AI时代催生了对数据库的更加多元化的需求,尤其是时序、向量、图等新型数据库的需求激增,极大地拓展了市场空间。更为重要的是,AI对数据库核心能力的要求,倒逼企业进行核心架构创新,这为坚持自主研发的数据库企业提供了“弯道超车”的机会,达梦数据作为深耕数据库领域的企业,便将此视为技术突破与快速发展的重要契机。
遥想产业互联网变革之时,曾经出现了“互联网+产业”还是“产业+互联网”的讨论和争议,在AI时代,如何把握机遇?也有不少人争论是“数据库+AI”还是“AI+数据库”?
李庄庄在演讲和采访中强调,AI和数据库是“双向赋能、互相融合”的关系,数据库自身可以用AI提升自身的能力,同时数据库也能为AI场景应用提供更高效的底层支撑。
比如,“数据库+AI”以数据库为核心,将 AI技术作为增强手段,提升数据库的性能、易用性与自动化水平。“AI+数据库”则以AI场景为核心,数据库作为AI的基础设施,提供数据存储、特征计算、模型部署等支撑。没有AI的加持,数据库难以应对复杂场景的挑战,没有数据库对数据的高效管理,AI模型就是“无米之炊”。
在AI时代,数据库厂商可以采取以下策略把握机遇。首先,从架构层面进行升级,通过存算分离、云原生、极致弹性等提升数据存储处理能力,同时集成向量、图、时序等多模数据处理能力;其次,通过AI提升数据库自动化管理能力,比如智能SQL生成、智能调优、故障预测、根因分析等;最后,在生态层面,需要充分开放,和AI工具链进行深度适配,简化AI训练中的工作复杂度。
图丨达梦技术副总经理李庄庄现场演讲
早有布局的达梦如何抓住智能化机遇?
达梦数据一直坚持自主开发的技术路线,作为全栈数据产品和解决方案提供商,在AI与数据库融合发展领域早已提前布局,2014年左右就开始了智能化方面的探索。
随着AI大模型技术的发展,技术迭代更快,达梦数据在核心技术、架构方面进行优化升级,更好地适应AI时代的要求,自此,其智能化发展也步入了快车道,如今达梦数据在AI领域获得了不错的发展:
在AI4DB方面,以达梦启云数据库和达梦数据库一体机为载体,推出了智能参数调优、SQL智能生成、数据智能探查、慢SQL根因分析/诊断、智能测试样例生成、达梦数字服务专家等AI新特性,大大提升了数据库的智能化程度和便利性,同时保障了数据库的高可靠和高性能。
在DB4AI方面,基于自主研发的技术路线,陆续推出了图数据库、时序数据库、缓存数据库、向量数据库以及多模数据库等能够支撑AI训练的多引擎数据库产品,可以为AI场景应用提供国产内生安全的底座支撑。
据悉,智能化发展已经带来了非常大的实际业务价值。以数据库智能参数调优为例,DM8有几百项参数,每个数据库在具体生产应用中面临的场景需求千变万化,参数的组合几乎是个天文数字,在以往的实际生产中,参数调优严重依赖DBA的个人经验。
在引进智能参数调优后,依赖人工的问题得到了明显改善。比如在启云数据库中在线发放一个数据库服务,可以根据数据库的规格、初始化参数和基本场景需求对参数进行智能推荐,同时在数据库运行中收集日志数据进行处理和训练,随时提供与数据库应用场景相匹配的参数组合。实际测试和生产应用表明,智能参数调优的效果高于DBA人工调优,而且可以节省大量的运维人力,对于数据库的使用者、建设方都有极大的降本增效价值。
图丨达梦技术副总经理李庄庄现场演讲
展望未来,李庄庄认为数据与AI的融合发展将大有可为,他指出了以下几个重点的数据库智能化发展趋势:
一是,智能化自治的程度会越来越高,像自主感知、动态调整架构、自动优化性能、硬件故障自修复等技术一定会快速发展,最终的目标肯定是“无人工干预”,就像真正意义上的智能驾驶一样。
二是,数据库和AI大模型的融合会越来越深,我中有你,你中有我,AI4DB成为标配,DB4AI成为默认。
三是,数据库和数据的使用技术门槛会显著降低,比如一键部署模型、SQL智能生成、智能数据分析等,AI让技术更加普惠。
李庄庄也强调,AI时代的变革才刚刚开始,AI的产品链生态链较之以往更长、更复杂,需要数据库厂商更加重视产学研用的“协同创新”。
小结:AI时代取胜的关键是什么?
AI为数据库的发展带来了更多可能性,同时也带来了更多变数。如今数据库百花齐放,竞争也格外激烈,想要脱颖而出并不容易。李庄庄指出,在信息领域有两个取胜的关键因素:
一是技术硬实力,没有核心技术的厂商是没有生命力的,达梦这么多年坚持自主创新,包括AI时代持续加大研发投入,就是出于该因素考虑,只有持续创新,才能拥有在市场上竞争的底气。
二是良好的落地价值,纯粹靠技术也较难胜利,如果没有将技术转化为 “开箱即用” 的解决方案,最终所有的技术都会成为空中楼阁,水中月镜中花,好看但是没用,所有成功都是建立在解决了客户问题,带来实际落地价值方面,这是核心,是达梦数据做全栈数据解决方案的原因所在。
AI时代,风高浪急,更需要自主创新带来的技术硬实力和持续在产业中的良好落地价值,如此才能乘风破浪,海阔天空。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
海报生成中...
海艺AI的模型系统在国际市场上广受好评,目前站内累计模型数超过80万个,涵盖写实、二次元、插画、设计、摄影、风格化图像等多类型应用场景,基本覆盖所有主流创作风格。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。