• 首页 > 云计算频道 > 大模型

    新视频分割技术SAM 可高效识别移动物体

    2024年04月23日 16:39:14   来源:站长之家

      在视频分割领域,Segment Anything 模型(SAM)被用于探索新的视频对象分割技术。研究团队测试了两种不同的模型,旨在结合 SAM 的分割能力和光流技术的优势,以提高视频分割的性能。

      SAM 与光流结合的模型:第一种模型中,研究者对 SAM 进行了修改,使其能够直接使用光流数据作为输入,而非传统的 RGB 图像。光流数据能够提供关于图像中物体运动的信息,这对于分割和识别移动物体特别有用。

      SAM 与 RGB 图像结合的模型:第二种模型则保持了 SAM 使用 RGB 图像作为主要输入的方式,但引入了光流数据作为辅助提示,以增强模型对视频中物体运动的识别和分割能力。

      这两种方法都展示了在视频对象分割任务中的潜力,即使没有进行复杂的修改或优化,也已经在单对象和多对象的视频基准测试中取得了显著的性能提升。

      此外,研究者还探索了将这些基于帧的分割方法扩展到整个视频序列上,以实现对同一物体在视频连续帧中的身份进行追踪。这种序列级别的分割技术能够连续地识别和追踪视频中的特定对象,即使在物体运动、场景变化或光照条件变化的情况下也能保持一致性。

      这些研究成果不仅提升了视频分割的精度和效率,而且通过简化模型的设计,降低了计算复杂度和资源消耗,使得实时视频分割和物体追踪变得更加可行。这些技术的进展对于视频编辑、安防监控、自动驾驶车辆的视觉系统以及许多其他应用场景都具有重要意义。

      目前,具体的技术细节、模型性能指标以及未来的研究方向尚未详细公布,但这些初步的研究成果已经为视频分割技术的发展提供了新的方向和可能性。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    华为Pura70 系列不怕丢!云空间实现楼层级设备查找

    华为 Pura70 系列突然先锋开售,你抢到了吗?对于这次的新机来说,除了一如既往的优雅设计和强悍的硬件配置外,我们更为关注的则是其全球首发的「楼层级设备查找」功能,软实力也可以很硬核!

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。