腾讯云推出全链路AI驱动应用开发平台“AI Builder”B站接入通义千问Qwen 3等模型 推出数据洞察智能体InsightAgent全球最大氢能燃料电池矿卡首秀!氢通能源集团从链主到全域引领中国氢能产业革命无惧极端环境!雷克沙C50V行车U盘为新能源出行保驾护航TCL科技强化供应链透明度,让每份原材料都有可追溯的“身份证”比亚迪联手字节!用AI赋能电池研发和制造,这故事够性感吗?广联智通推出三频Wi-Fi 7无线路由Flint 3 (GL-BE9300)昆仑万维正式发布并开源软件工程模型Skywork-SWE-32B网易3A级开放世界游戏《归唐》预告公布:安史之乱背景下无名英雄之旅刘强东给外卖小哥1000元小费惊呆网友,啥营销都比不过发钱!联想Legion Go 2掌机有望在今年9月登陆其第一方在线商店为什么“Labubu们”都选择阿里速卖通出海?消息称谷歌 Waymo 扩张出租车版图:重返纽约路测、扩大服务区不止 iPhone 17 Air,消息称华为等多款新机也在测试 eSIMCounterPoint 报告2025Q1全球乘用车车机销量:德赛西威同比增25%AI赋能高考志愿填报 在问志愿星操作简便,输出全面铠侠推出新一代PCIe 5.0数据中心固态硬盘CD9P 基于 BiCS 8 TLC智能锁618王牌单品出炉,德施曼Q5FPro成国民爆款苹果新专利:提升光标控制与手部追踪技术体验 2025-06-20 09:41:02三年0佣金!京东“复制”外卖打法强攻酒旅?
  • 首页 > 云计算频道 > 大模型

    昆仑万维正式发布并开源软件工程模型Skywork-SWE-32B

    2025年06月20日 11:10:42   来源:Citnews中文科技资讯

      6月20日,昆仑万维(300418)发布软件工程(Software Engineering, SWE)自主代码智能体基座模型Skywork-SWE,在开源32B模型规模下实现了业界最强的仓库级代码修复能力。

      相比传统的代码生成任务(如代码编程题解答),SWE任务更加贴近真实的软件开发流程,涵盖了从定位BUG、修改源代码,到验证修复效果的完整闭环。

      昆仑万维团队通过构建超过1万个可验证的GitHub仓库任务实例,打造出目前最大规模的可验证GitHub仓库级代码修复的数据集,并系统性验证了大模型在软件工程任务上的数据缩放定律(Scaling Law)。

      Skywork-SWE-32B模型在SWE-bench Verified基准上取得38.0% pass@1准确率,刷新Qwen2.5-Coder-32B系列模型在OpenHands代码框架下的最佳成绩。

      进一步引入测试时扩展技术后,模型表现提升至47.0%的准确率,不仅超越了现有参数规模在32B以下的开源模型,也显著效缩小了与闭源模型之间的性能差距。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。