• 首页 > 数据存储频道 > 数据库频道 > 操作系统与开源

    无绿幕MR特效 谷歌开源AI语义分割模型DeepLab-v3+

    2018年03月16日 09:34:08   来源:yivian

      2018年03月16日,在3月出我们有报道说谷歌利用AI实现视频的背景分离,而这涉及到语义图像分割技术。语义图像分割是指将诸如“道路”,“天空”,“人”,“狗”等语义标签分配至图像中的每一个像素,从而实现一系列的新应用,比如Pixel 2和Pixel 2XL人像模式中的合成浅层景深效果,以及实时视频分割。

      分配语义标签需要精确定位对象的轮廓,因此这比其他视觉实体识别任务(如图像级分类或边界框级检测)要求的定位精度更严格。好消息是,映维网了解到谷歌日前在GitHub上开源了最新的语义分割模型DeepLab-v3+(应用在Tensorflow)。

      这一版本包含基于强大卷积神经网络(CNN)骨干体系架构构建的DeepLab-v3 +模型,旨在应用于服务终端。另外,谷歌同时分享了他们的Tensorflow模型训练与评估代码,以及已经预先经过训练的Pascal VOC 2012和Cityscapes基准语义分段任务模型。

      自三年前Deeplab模型的第一次出现以来,优化的CNN特征提取器,更好的对象比例建模,对情景信息的详细同化,改进的训练过程,以及越来越强大的硬件和软件带来了DeepLab-v2和DeepLab-v3的优化。对于DeepLab-v3 +,谷歌添加了简单而有效的解码器模块以细化分割结果,尤其是沿对象边界。谷歌进一步将深度可分离卷积应用于空间棱锥面缓冲池和解码器模块,从而形成更快速,更强大的语义分割编码器-解码器网络。

      由于方法,硬件和数据集的进步,构建在卷积神经网络之上的现代语义图像分割系统已经达到了五年前难以想象的精度。谷歌希望与社区分享他们的系统,从而帮助学界和业界的其他团体能够更容易地进行复刻,同时进一步优化系统,对新数据集进行模型训练,并且为这一技术设想新的应用。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。