• 首页 > 企业IT频道 > 软件即服务

    Vibe编码公司:有了Claude 4,语法错误减少25%、提速40%

    2025年05月26日 17:14:10   来源:站长之家

      Lovable 是一家使用 Claude 模型的 Vibe 编程工具公司,该公司表示:部署 Claude 4 之后,其代码错误率降低了 25%,运行速度提升了 40%。

      5 月 22 日,Anthropic 开始陆续推出两款新模型:Claude Sonnet 4 和 Claude Opus 4。其中,Sonnet 向免费用户开放,而 Opus 则需付费订阅,并且在编程方面的表现优于 Sonnet。

      Anthropic 在官方博客中确认,Claude Opus 4 在软件工程基准测试 SWE-bench 中得分为 72.5 分(SWE 是“Software Engineering Benchmark”的缩写)。

      Claude 4 的表现

      在测试中,Claude Opus 4 在需要长时间专注、包含数千步操作的任务中表现出稳定的性能。Anthropic 还声称,该模型曾连续运行 7 小时专注于编码任务。

      使用 Claude 模型进行“基于提示的网页和应用构建”的公司 Lovable,在升级为 Claude 4 后也观察到类似的改进。

      该公司在 X(原 Twitter)发文称,自从部署 Claude 4 后,其在所有项目(包括旧项目)的创建和编辑任务中,整体错误率下降了 25%,运行速度提升了 40%。

      Claude 4 在 Lovable 上的表现:

      Claude 4 显著减少了语法错误。Lovable 创始人 Anton Osika 还在另一条贴文中确认说:“Claude 4 几乎消除了 Lovable 的大多数错误”,特别是指在 Vibe 编程中出现的 LLM(大语言模型)语法错误。

      Claude 4 是优秀的编程模型?

      虽然外界对 Claude 4 的评价褒贬不一,但作者个人指出,在开发 Dart/Kotlin 应用时,Claude 4 相比 Gemini 产生的代码错误更少。

      当然,这取决于具体项目和上下文。但在不需要超长上下文的项目中,Claude 4 的表现优于 Gemini。

      尽管 Claude 系列一向有“最擅长编程”的口碑,但最近也面临谷歌的激烈竞争。谷歌发布的 Gemini 2.5 Pro 拥有 100 万 token 的上下文窗口,相比之下,Claude 4 及早期版本为 20 万 token,在上下文容量方面有劣势。但这并不意味着 Gemini 2.5 在编程方面就一定优于 Claude 4。

      这两个模型有时都能令人惊艳,也可能出错,全看提示工程的质量。

      理想的组合方式可能是:用 o3 或 Gemini 进行规划,再用 Claude 4 或 Gemini 进行具体编程任务。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    vivo携手首届商学院戈壁友谊赛,以专业影像见证无畏征途

    2025年5月4日,首届商学院戈壁友谊赛于甘肃省酒泉市圆满举办。在这场4天121公里的戈壁征途中,vivo作为战略合作伙伴,为赛事提供手机、智能穿戴设备及定制影像服务,以技术赋能助力参赛选手与观众记录戈壁之上的热血奔赴,共同探索科技进步、商业文明与自然共生的未来路径。

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。