视频搜索和视频教育的机器学习-它如何工作

Ayn de耶稣
《阿凡达》

Ayn在Emerj担任人工智能分析师,涵盖人工智能在各个行业的应用案例和趋势。金博宝官网她此前曾在埃森哲担任多个职位。

金博宝官网用于视频搜索的人工智能和未来的YouTube

剧集摘要:ai,特别是自然语言处理,使更容易理解文本作为更深,更高效的方式和规模更深入的文本。通过视频,情况却完全不同。AI已经被用来提供帮助在视频媒体工作的行业。然而,在视频中搜索内容更具挑战性,因为视频不仅仅是声音和声音,它也是屏幕上移动和静止图像的集合。人工智能如何克服这一挑战?

在这一集AI在工业中在播客中,我们采访了VideoKen的首席执行官和联合创始人,以及班加罗尔国际信息技术学院Infosys的主席教授Manish Gupta博士,关于视频搜索的未来,因为机器学习越来越多地融入到过程中。古普塔博士谈到了视频的可搜索性如何变得越来越强,并讨论了他自己对未来的预测。他还预测,随着人们继续搜索更具体的视频内容,机器学习将让Youtube做什么。

我们的内容领先,raghav巴拉加入我们的采访。

订阅我们的人工智能行业播客使用您最喜欢的播客服务:

itunes-podcast
soundloud-podcast
google-podcast
Stitcher-Podcast.

客人:Manish Gupta博士,联合创始人兼首席执行官,威慑

专业知识:高性能计算,编译器,分布式系统,虚拟机优化

简要承认:古普塔博士还是班加罗尔国际信息技术研究所印孚瑟斯基金会的讲座教授。此前,他曾担任施乐印度研究中心副总裁兼董事。他曾担任IBM的领导职务,包括IBM Research India的董事和IBM India/南亚的首席技术专家。作为IBM沃森研究中心的高级经理,古普塔博士领导了Blue Gene/L超级计算机软件开发团队。

他在Urbana Champaign的伊利诺伊大学赢得了博士学位。他共同撰写了75篇论文,并在谷歌学者中有超过6,000名与高性能计算,编译器和虚拟机优化相关的引用。Gupta博士也获得了19个美国专利。

采访中强调了

(3:13)在商业环境中,人工智能在视频数据中发挥什么作用?

古普塔:资源视频功能强大,但往往不透明,不像你可以快速可视化的文本。你通常需要从头到尾播放整段视频才能弄清楚内容。但是人们没有耐心看一段30分钟的信息视频。

VideoKen正在查看一类视频,比如讲座、信息视频、演示和培训。我们的出发点是在视频末尾自动构建内容表和词汇表等功能。我们利用人工智能技术来分析视频内容。在视频里的数千个单词中,哪一个是最重要的单词?

(6点半)有没有对这些图像的分析?

MG:是的。特别是对于内容表,我们觉得信息视频中的视觉数据,特别是讲座,以极为丰富,比我们从音频获得的数据更丰富。我们的应用程序识别视频的哪些特征包含视觉上丰富的文本。这是可以使用AI的,并且是该技术试图识别产品特征的分类问题。它是文本形式的丰富信息吗?一旦确定,您必须识别突出文本。

以幻灯片形式的讲座为例。话题的改变通常发生在幻灯片的边界。这部分信息非常丰富。应用程序从这部分中提取了重要的词。这些游戏的内容也更丰富。

(9:00)专注于为视频开发人工智能,你需要找到信息视频的共同特征,如讲座和幻灯片。如何为这类视频训练算法呢?

MG:我们在起点,就像一本教科书。但你也可以对演讲的不同部分进行分析,发现其中涉及的概念。我们可能会从音频中获得一些视图。不同的老师有不同的方法来改变话题。

(09:55)你必须找到一套新的模式来训练新的教学模式的算法。

MG:(话题或幻灯片之间)通常会有更大的间隙或沉默。但你不能预先编程所有这些细微差别或变化。他们必须从数据中学习。

(10:28)在创建目录或术语表时,是否有一个检查算法提取信息的效果的过程,或者如何训练它们做得更好?

MG:我们创建了一个编辑工具,使最终用户能够修改。生产视频是劳动密集型。但是要编辑由应用程序创建的内容表所需的努力量通过能够编辑或更改几个条目来简化。

(12:15)当企业用户编辑目录或术语表时,这将作为系统的反馈。它的目标似乎是从用户的角度来推动机器学习,而不是从自然语言处理专家的团队。

例如,我希望在2015年在冻土带环境下进行石油和天然气钻探。我只是想看看那些显示钻孔的部分。我们的目标是找到查询这些特定部件的方法。这是目标吗?

我们正在努力使搜索过程更容易一些。不仅在视频中搜索,也在视频中搜索。你不会想让一个人看完一整个小时的视频吧。

(15:00)YouTube的平台是一系列音乐,娱乐和教育。找到商业主题并不是他们的利基。您的利基是需要以节省时间教育人民的组织。

MG:这是起点。我们的一个实现之一是没有公司正式利用这种资源。大多数公司都有课堂课程或购买内容以在其员工培训中使用。其中一个录取的东西是启用的,它正在利用在YouTube上自由上可用的视频中包含的这笔资料。仅在YouTube上有300万个教育视频。但公司无法找到高质量的视频,因为它是一种痛苦。公司如何从低质量的视频中分开高质量?从那里,他们可以为其上下文选择适当的内容。

大多数公司都会举办客户活动,活动内容会发布在Youtube上。人们可能只会看到视频的早期部分。我们的应用程序能让用户处理这些视频,让它们更容易消费,更有影响力。

这些视频的应用远远超出学习。我们可以使用客户的视频,我们可以使用我们的应用程序索引它们。

(17:55)在接下来的两三年里,视频的分析可以成为可能。你在哪里看到的?

:下一步是发展对视频的更深入的理解。其中一个挑战是识别名词和动词。所以我们的工作是对名词(名字,物体,人,地点)的识别和动词(活动)的识别。这适用于创建标题。

订阅我们的人工智能行业播客使用您最喜欢的播客服务:

itunes-podcast
soundloud-podcast
google-podcast
Stitcher-Podcast.

标题图像信用:验光首席执行官

保持领先于AI曲线

发现在业务未来将赢家分开获奖者的关键AI趋势和应用程序。

注册“AI Advantage”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
走在机器学习曲线的前面

加入超过20,000名专注于AI的商业领袖,每周接收我们最新的AI研究和趋势。

感谢您订阅EMERJ“AI Advantage”时事通讯,请检查您的电子邮件收件箱进行确认。