本篇文章1869字,读完约5分钟
作者:秦丽,雷锋之家嘉宾频道首席作家。
说到看无数部电影,你一定还记得首席法医汤丸。
如果同时有10,000张唐丸实时在线照片,世界会是什么样子?
是的,那幅画太美了,我不敢去想它。然而,9月15日,在百度云志峰会的子论坛“视频智能技术与平台”上,百度云高级产品专家黄凤在视频ai产品发布中引入了“复制万唐丸”的功能。
这到底是怎么回事?
现在每个人都在播放666现场直播,短片也非常火爆,到处都需要摄像头,这就造成了一个严峻的形势:视频的数量正在大幅增加,但是谁知道是否有一些奇怪的东西,比如色情和赌博毒品。
个人可能看起来快乐(或不快乐?),平台应承担相应的责任。因此,这些企业非常恼火:现在集团的所有者可能被拖垮,更不用说我们的平台了?!
因此,百度云借此机会利用视频人工智能技术推出了内容分析vca、内容评论vcr和封面智能选择vcs。
准确分析卢汉和博老师在做什么。让我们从内容分析开始。
除了视频比海洋更深这一事实之外,许多企业过去还依赖人工审查和注释团队。所谓的人工审查和注释意味着一群勤劳的唐丸不断地识别视频和标签。如果只是屏蔽色情内容,如果我想对内容进行分类和推荐,我应该怎么做?
唐丸的身体不仅cut/きだよ 0/~的人工成本太高,而且企业负担不起这么多唐丸。毕竟,人们在用他们的生活工作,这是非常昂贵的。
这时,人工智能技术开始使用。
在得到一段视频后,人工智能版的唐丸将视频分成了几层:镜头、画面和声音。然后,它开始视频场景识别、人脸识别、字幕识别、对象识别、同步语言识别,并对语音识别的结果进行交叉认证,从而准确地判断这个人在什么场景中做什么以及他周围有什么对象。
黄凤说,这些识别模型使用1000多万个训练数据,可以识别5000多个场景和4万种物体,并使用百度的人脸识别技术,以及百度百科公共人物数据库和定制人脸数据库。
也就是说,他不仅可以从大量的视频中检索到卢汉,还可以识别出是卢汉在邮箱旁拍照还是卢汉在跳舞。
或者,是在中国工作的老师,拿着魔杖,或者是在日本加班拿道具的博。
黄凤表示,与人工相比,vca分析效率提高了5倍,日吞吐能力相当于1万人,分析成本降低了50%,召回率提高了10倍。
“焦川模式”一句话不说就能识别驾驶。你最关心的黄健来了。哦不,内容审查录像机。
根据vca的内容分析,汤艾·马鲁说,视频被分层为帧和音频,然后将这两个(图像)与视频黑库中的图像指纹和声纹指纹进行比较。ai会自动识别这个视频中的色情、恐怖、政客和广告。
(似乎视频黑图书馆实际上是一个小黑屋?(
字幕是通过对视频中的图片进行文本识别得到的,视频中的语音也是通过长语音识别变成文字的,这两部分文字要经过文本审查。
问题来了。如果什么都没有,照片没有曝光,如果你们不同意对方,你们会开车,只会有难以形容的哀鸣声呢?
黄凤说,别担心,在人工智能识别中我们也有“焦川模式”,它可以识别这些难以形容的声音。
经过对这些视频内容的严格审查,汤艾丸有三种处理模式:通过、禁止和人工审查。
所谓的人类试验意味着你隐藏得太深,你甚至不能处理这个人工智能。让我真正的唐丸出去!
黄凤指出录像机有更多的用途:
视频重复数据消除:两个定义不同但内容相同的视频,当然,取其中一个。
广播电视监管。
侵权检测:纳尼,你为什么是海盗?
面值就是正义:点击一下就能帮你选择封面图片。雷锋家做客频道的编辑也不想承认这一点,但是没有办法。如果你去超市买一个西红柿,你会选择一个看起来更好的。!!
黄凤表示,视频封面的质量对用户点击量有很大影响。
换句话说,平台必须选择一个更具精神内涵和和谐美感的封面!
他向雷锋介绍了选择vcs封面图片的过程。通过三个步骤:镜头检测-主观/客观质量过滤-内容相关性,人工智能帮助视频选择最佳封面照片。
(这个过程不亚于女孩从一堆自拍中选择一个朋友圈,对吗?(
让我们来看看之前封面选择效果和vcs选择效果之间的比较:
[图1]
[图2]
[图3]
[图4]
图1和图3是先前封面选择的结果,示出了部分或单个图像,图2和图4是vcs的选择,图2示出了人和宠物之间的关系,以及图4示出了完整的汽车。
事实上,在听证会结束时,主宾频道的编辑软弱无力,并提出了一个终极疑问:这和百度云有什么关系?
黄凤表示,这是百度云的视频人工智能功能,可以通过在线交流、定制解决方案和测试对接正式推出。
好吧,好吧,你说得对。
不管怎样,《雷锋》的编辑。(公开号码:雷锋。笑到他抽搐。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:为了找出羞羞视频,百度云居然有“娇喘模式”
地址:http://www.hcsbodzyz.com/hcxw/7502.html