本篇文章1050字,读完约3分钟

人工智能的应用正在如火如荼地进行,技术巨头之间的技术竞争也在激烈进行。3月29日,在国际顶级赛事pascalvoc Challenge的目标检测竞赛3子任务中,搜狗人工智能图像团队提交的fpnssd深度模型获得了77.0的高分,刷新了该任务的世界最好成绩。(结果查询网站:t/rnmrmao)。 pascalvoc Challenge是计算机视觉目标检测的经典权威竞赛。其数据集标注质量高,场景复杂,目标多样,检测困难,是快速检验算法有效性的首选。在计算视觉领域,pascalvoc Challenge是与imagenet的全球顶级竞争对手,也是国内外ai公司激烈竞争的主要舞台。 pascalvoc的数据集包括20个类别:人类、动物(鸟、猫、牛、狗、马、羊)、车辆(飞机、自行车、船、公共汽车、汽车、摩托车、火车)和室内物品(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。其中,搜狗影像团队参与的竞赛3个子任务以官方数据集作为训练集,不能添加其他附加标签数据,更好地反映了参与团队的模型设计和技术技能。 搜狗图像团队开发的fpsd检测算法借鉴了视网膜架构设计思想,优化了经典的ssd检测算法,设计了基于resnet152的特征金字塔网络(fpn)网络结构,同时结合了浅层和深层的多尺度特征信息。这种模型选择和优化策略大大提高了小目标物体的检测能力。在这次挑战中,搜狗图像团队的fpnssd检测算法在20个子类别中的10个项目中获得了第一名,其中在鸟、猫、狗等小物体中优势明显,充分验证了fpnssd检测算法在模型结构设计上的先进性。 此外,FPNSD检测算法采用软最大损失+硬否定的训练方法,在FPNSD框架下比行业中常用的基于无聚焦的训练方法精度更高。 搜狗影像团队成员大多来自清华大学、北京大学、中国科学院、浙江大学等高校,并先后获得数十项相关技术专利。该团队长期致力于前沿领域的研究,如场景文本检测与识别、人脸识别、细粒度图像分类、敏感图像检测、图像理解等。相关成果已广泛应用于搜狗旅游翻译宝典、搜狗翻译应用、搜狗输入法、搜狗王寨答案助手、搜狗地图识别等产品中。,满足用户在许多垂直领域和特定场景中日益多样化和个性化的应用需求。 不仅如此,搜狗人工智能图像团队的尖端成就,还通过搜狗的人工智能开放平台,为金融、保险、医疗和其他行业的客户提供高质量的人工智能服务和解决方案。搜狗作为人工智能的领军企业,未来将在更多基于图像识别技术的场景上有进一步的突破和创新,带来更丰富、更便捷的人工智能体验。

标题:搜狗挑战计算机视觉国际顶级赛事Pascal VOC 刷新世

地址:http://www.hcsbodzyz.com/hcxw/2830.html