拼多多发布2024四季度及全年财报 陈磊:坚持高质量发展战略不动摇引领显示、智能终端创新,TCL多款新品荣获AWE 2025艾普兰奖破局2025!第二届推客大会暨首届推客大赛颁奖盛典5月27日长沙定档全球首款RGB-Mini LED电视售价27999元起联想摩托罗拉razr 60 Ultra小折叠手机“木纹后盖”版本曝光 引入Edge 50 Ultra设计3月24日打开京东搜「1」 3C数码“疯狂星期一”低价来袭传三星取消SF1.4制程,韩国半导体技术瓶颈与市场困境下艰难求生两部门:人脸信息应当存储于人脸识别设备内,不得通过互联网对外传输雷丁汽车“卷土重来” 预告 A50 短途代步微型车下半年上市海信首发1000nits全屏亮度激光电视探索X1亮相AWE 2025闻泰科技拟出售子公司股权 专注半导体业务发展中国平安2024年报:营收净利双增 核心人员持股计划深化利益绑定苹果折叠iPhone将采用液态金属轴承 宜安科技成主要受益者理想汽车发布新一代自动驾驶技术MindVLA,预计7月与理想i8同步首发得一微即将推出PCIe 5.0固态硬盘主控YS9503不再用Windows/Linux!华为首款鸿蒙PC来了 余承东:鸿蒙要成全球第三大电脑OSReka开源Reka Flash3,能力超Gemma327BSider AI推出Deep Research功能:能自动模拟人类研究行为,还能生成可视化交互式报告MiC 建筑:城市可持续发展的模块化解决方案DomoAI推出语音图像生成数字人功能:数字内容创作迎来新突破
  • 首页 > 云计算频道 > 大模型

    超越GPT-4V!智谱AI第二代视觉大模型CogVLM2,19B参数跑出卓越性能

    2024年05月23日 09:29:10   来源:中文科技资讯

      继去年发布并开源VisualGLM-6B和CogVLM之后,智谱AI宣布近期将推出新一代多模态大模型CogVLM2。这款模型以其19B的参数量,在性能上接近或超越了GPT-4V。

      据悉,CogVLM2系列模型在多个关键指标上实现了显著提升,如在 OCRbench 基准上性能提升32%,在TextVQA基准上性能提升21.9%,且模型具备了较强的文档图像理解能力(DocVQA)等。此外,CogVLM2支持8K文本长度和高达1344*1344的图像分辨率,同时提供中英文双语的开源模型版本。

      CogVLM2 继承并优化了上一代模型的经典架构,采用了一个拥有50亿参数的强大视觉编码器,并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块。这一模块通过独特的参数设置,精细地建模了视觉与语言序列的交互,确保了在增强视觉理解能力的同时,不会削弱模型在语言处理上的原有优势。这种深度融合的策略,使得视觉模态与语言模态能够更加紧密地结合。

      值得注意的是,尽管CogVLM2的总参数量为190亿,但实际激活的参数量仅约120亿,这得益于精心设计的多专家模块结构,显著提高了推理效率。此外,CogVLM2能够支持高达1344分辨率的图像输入,并引入了专门的降采样模块,以提高处理高分辨率图像的效率。

      在多模态基准测试中,CogVLM2的两个模型,尽管具有较小的模型尺寸,但在多个基准中取得 SOTA性能;而在其他性能上,也能达到与闭源模型(例如GPT-4V、Gemini Pro等)接近的水平。

      开发者可以通过GitHub、Huggingface、魔搭社区和始智社区下载CogVLM2的模型,团队还透露,GLM新版本会内嵌CogVLM2能力,在智谱清言App和智谱AI大模型MaaS开放平台上线。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. S026]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。