• 首页 > 云计算频道 > 大模型

    DeepSeek-V3.1发布:更高思考效率 更强Agent 能力

    2025年08月21日 17:15:57 来源:AIbase基地

      深度求索科技有限公司正式发布了其最新版本的AI模型——DeepSeek-V3.1。此次升级标志着公司在迈向Agent时代方面迈出了坚实的第一步,为用户提供了一个更加强大、高效且多功能的人工智能解决方案。

      DeepSeek-V3.1的发布带来了多项重大改进。首先,该版本引入了混合推理架构,使得一个模型能够同时支持思考模式与非思考模式,为用户提供了更灵活的选择。在思考模式下,DeepSeek-V3.1-Think相较于之前的DeepSeek-R1-0528版本,能够在更短的时间内给出答案,显著提高了思考效率。此外,通过Post-Training优化,新模型在工具使用与智能体任务中的表现也得到了大幅提升。

    微信截图_20250821145744.png

      为了更好地服务用户,官方App与网页端模型已同步升级至DeepSeek-V3.1。用户可以通过点击“深度思考”按钮,轻松实现思考模式与非思考模式之间的自由切换。同时,DeepSeek API也进行了同步升级,其中`deepseek-chat`对应非思考模式,`deepseek-reasoner`对应思考模式,且上下文容量已扩展至128K。此外,API Beta接口还新增了对`strict`模式的Function Calling支持,确保输出的Function满足schema定义。

      DeepSeek-V3.1还增强了对Anthropic API格式的支持,使得用户能够轻松地将该模型的能力接入Claude Code框架。这为开发者提供了更大的灵活性,进一步拓展了模型的应用场景。

    微信截图_20250821145433.png

      在工具调用和智能体支持方面,DeepSeek-V3.1也取得了显著进步。在编程智能体测评中,无论是使用内部框架还是在命令行终端环境下进行复杂任务测试,DeepSeek-V3.1相较于之前的版本都有了明显的提升。在搜索智能体测评中,DeepSeek-V3.1在多项指标上也取得了较大提升,尤其是在需要多步推理的复杂搜索测试和多学科专家级难题测试中,其性能已大幅领先于之前的版本。

      此外,DeepSeek-V3.1在思考效率方面也进行了优化。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,在非思考模式下,V3.1也能够有效控制输出长度,保持与之前版本相同的模型性能。

      为了进一步推动技术的开源与共享,DeepSeek-V3.1的Base模型已在Huggingface和魔搭平台开源。Base模型在V3的基础上重新进行了外扩训练,增加了840B tokens的训练量。

      在价格方面,深度求索科技有限公司宣布,自北京时间2025年9月6日凌晨起,将对DeepSeek开放平台API接口调用价格进行调整,执行新版价格表,并取消夜间时段优惠。在9月6日前,所有API服务仍按原价格政策计费,用户可继续享受当前优惠。同时,公司已进一步扩容API服务资源,以更好地满足用户的调用需求。

    中文科技资讯微信二维码logo

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    海报生成中...

    最新新闻

    热门新闻

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。