AI搜索应用的合规,合同,和人力资源

丹尼尔Faggella.
头像

Daniel Faggella是Emerj研究的首脑。丹尼尔呼吁由联合国,世界银行,国际刑警组织和龙头企业,丹尼尔是AI对商业和政府领导者竞争战略影响的全球追捧。

AI搜索应用的合规,合同,和人力资源

有一个整个人工智能生态系统,用于企业金博宝官网搜索。大部分是纯粹的数字世界。大多数供应商有助于一层启用AI的搜索,以了解术语或短语,并且能够返回某人类型的问题的结果或答案。但是在寻找物理世界时,问题是复杂的。

银行可能需要寻找财务记录例如,回到40年来处理诉讼,并且他们可能不得不在不同的储存设施中调查数码文件,而是在各种非现场地点的不同存储设施中进行缩略图和印刷纸。

这是一个具有挑战性的问题,但对于那些不想花两周时间把律师锁在房间里,让他们解决一些法律问题或找到过去合同中的某些条款的律所来说,这是一个很重要的问题。银行希望能够搜索它们,无论它们是实体的还是数字的,并更快地找到它们想要的东西。

这就是本周这集的主题AI在工业中。我们的客人是铁山产品管理总监Anke Conzelmann。铁山是一家位于波士顿地区的四十亿美元的物理存储公司。

他们处理一些最大的记录金融卫生保健,零售世界各地的品牌。Conzelmann与我们谈论人工智能的未来潜力,以便在企业内搜索,而不仅仅是数字文件,而是跨格式。金博宝官网

关于人工智能搜索应用的更深入分析银行,下载铁山 - emerj共同品牌白皮书在这个话题。

订阅我们的AI在行业播客用你最喜欢的播客服务:

itunes-podcast
soundloud-podcast.
Google-Podcast.
Stitcher-Podcast.

来宾:Anke Conzelmann.,产品管理总监 -铁山

专业知识:企业采用基于人工智能的搜索应用

简要认识:anke自2003年以来一直是铁山产品管理的总监。在此之前,她是在差别通信收购之前的Dragon Systems的产品经理。

采访中强调了

(2:3)您在哪里看到基于AI的法律搜索的大多数机会?

AC:这实际上是一个很棒的用例,合同。每个公司都有他们,我们都希望我们有很多。

拥有更多客户合同是好的,但它也意味着我们已经有一个非常分布式的来源集。[它]可以通过产品...按地区......真的很难回答真正简单的问题,就像“这个特殊客户的所有合同在哪里?“当您考虑回答问题时,它变得更加困难,”这些客户中的哪一个有非标准付款条款?“一般来说,现在你开始阅读合同。当然,这没有规模。

另一个问题是,您可能不一定能够确定您抓住了所有这些问题。因此,每个公司都有这个问题,每个公司都可以真正受益于使用其中一些机器学习和AI驱动的分类和元数据丰富,以便使这些类型的问题易于回答。

(4:30)还有什么其他有趣的用例不适合人类,但可以用机器搜索这些契约?

AC:另一个真正的好人实际上是人力资源......每个客户都有人力资源部门。每个客户持有员工数据。因此,随着在欧洲颁布的隐私法,在加利福尼亚州来了......明年巴西,这实际上即将成为一个普遍的要求。除非您实际上可以以规模执行这些事情,否则要求很难见面。

个人信息在哪里?我在哪里有员工信息,我可以找到它吗?我可以在员工请求时产生它吗?我可以在我需要删除它时删除它吗?

随着这些隐私法改​​变的事情之一是坦率地说,“我为每个保留政策保留所有保留政策的一切”是不再可行的。哦,顺便说一下,遵守这些隐私法规:如果你不能这样做,他们就是很大的罚款。您正在观察收入的2%至4%,或者为GDPR的收入为10欧元至2000万欧元。两者的较高,顺便说一句,不是较低的,所以非常大的罚款来了。

因此能够识别个人信息在实体和数字文档中的位置。例如,我在铁山待了很长一段时间。当我第一次来的时候,有纸质的表格需要填写。这些还在某个地方,但也有一些数字信息是在我上个月进行审查时收集的。那么,我如何通过这些不同的实体和数字信息存储库呢?有些可能是Office文档,有些可能是图像,有些可能是谁知道是什么。

所以不同种类的内容,真正地跨越它并且能够回答每一个源文件的问题。比如,“个人信息在哪里?”能够说:“好吧,给我这个员工的个人信息,这些信息是我从那些不同的存储库中获取的。”可靠地发现,能够以一种合适的方式保存它从安全和访问控制的角度来看,并应用保留策略,如果我明天退出,七年后这些文档的保留可能会到期,当公司不再需要保留这些信息时,它有义务删除这些信息。

人力资源文件中的隐私绝对是另一个用例,你不能真正地搂着人们。

(8:00)公司需要做些什么,其中一家在其中一个较大的搜索和挖掘纸张,数字,图像,整个九个码?

AC:它是现有的员工甚至。作为员工,或作为客户的客户,您有权询问您要么所雇用的公司,或者您正在与您的业务有关,他们正在遵守哪些信息,他们保持着您。首先,您需要能够及时回答这个问题并及时回答。

第二件事是,作为一名员工,我现在有纠正的权利。意思是,我应该可以告诉你,这是错的。你需要纠正它。”然后我还需要能够得到这些东西。让我能够说,“好吧,安科,给你。这是我们拥有的所有包含你个人信息的文件。”你需要能够产生所有这些信息。

然后,最后,它是遗忘的权利,是它所谓的。这是一个没有业务的作品,你收集信息的原始经营目的不再相关...... [员工]不再为公司工作[S],现在我必须摧毁该信息。我必须这样做,以便我可以根据政策证明我做到了。

我需要能够表明我实际上根据该员工的终止,我实际上开始了我的时钟从保留的角度滴答。无论是退出,还是放手,并不重要。然后让那个时钟耗尽,让我有一个标准过程,我现在正在进行和销毁信息。无论是数字,无论是数字的。我需要能够始终如一地做到我持有这种信息的地方。

这就是在哪里,再次摄取所有这一点进入端到端的平台,在那里我不仅可以将实体信息数字化现在可能摆脱物理,以便我不必处理那条线。I can take all of the information that’s coming out of digital repositories, could be file shares, could be SharePoint sites, HR shared drives, and pulling that all into a common repository so that I can then very easily comply with what I need to do from a policy perspective.

这是找到所有这些东西的另一个好处,能够为全部摄取它,能够丰富它,拔出关键信息,“员工的这份文件是什么?它是什么文档?它有个人信息吗?“现在我可以用需要应用的策略适当地对待它。

(12:00)是否有其他用例,你觉得值得指出?

AC:绝对地。有一些非常简单的。当你开始谈论合同时,你认为合法,但它实际上不仅仅是一个有兴趣的公司内的合法。你有一个真正简单的问题,也许是刚刚被分配了一个能够说的新帐户的销售人员,“好的,向我展示这个帐户的所有合同。”那是一个。

然后在法律领域,假设你进行了一项收购,你现在有一大堆来自收购的合同,坦白地说,你真的不知道里面有什么条款以及它们如何与你的条款相比较。这是另一个用例:能够将某些东西与你的标准进行比较,能够找到条款与你的标准有本质区别的地方,能够集中于此。换句话说,让律师接触到那些实际上可能有问题或最需要关注的问题。

然后另一个是责任的限制。这是一个非常受欢迎的人。GC由一名初级律师散步,并说:“嘿,这最近的收购,我们的曝光从这些客户合同中的数据违反的限制是什么?”你今天怎么回答?好吧,你把一群整个这些律师锁定到一个房间里,可能是几周的阅读合同。您可以提取该信息,并使可用的可用点击视觉搜索UI中的几次点击以查找标准术语高于标准术语的合同,也可以从特定条款那样关注我们的责任,如责任的数据泄露限额。

它确实遇到了。这是一个思考问题所在问题的问题,并使用机器学习和AI来丰富信息,以便能够回答这些问题。

事实是,有时候我们会协商不同的条款。有时我们使用客户的纸,因为那就是最终发生的事情。有时候,你会看到来自利润和收购的东西看起来完全不同。

实际上,机器学习和人工智能的力量在于,你可以做到这一点,甚至当你在处理看起来很不一致的内容时,所以能够找到我要看的那个正确的条款。是的,它确实需要培训,但我们能够在一个平台上做到这一点,在这个平台上,我们将它作为一个预先培训的模型,针对特定的客户进行改进,而不是让客户自己去做。

(16:00)铁山正在进行金融服务,银行业,保险,活力。搜索和发现AI适合这些垂直例子的一些有趣方式是什么?

AC:实际上,能量是一个很棒的能量。同样,我认为它说明了我们谈过的各种部分。能源中的一个用例是,你有你的地球科学家,他们正在寻找公司所需的所有不同资产,以便在周围推动决定,“我应该在哪里钻?”或者,“给定井的价值是什么?”

您正在处理的东西可能是纸张的巨大地图,因此数字化了那些并能够利用这些。它们有胶带上的地震数据。磁带上有巨大的地震数据,因此能够破解那些开放,摄取那些内容,并使地质学家可用,以及可用的所有数字出生的信息。因此,其中一个地球物理学家需要能够利用的众多信息。

他们需要利用它的方式是基于,“向我展示地图上某个点的一切。”因此,他们面临的难度是他们花费一半的时间搜索与实际分析信息发生在跨越所有不同的存储库,而且坦率地,并不确定他们找到了所有这些。

有些数据的生成成本非常昂贵,所以你需要确保你使用的是你已经拥有的数据,而不是可能找不到它,然后再生成它。从输入的角度来看,各种实体和数字来源都很重要。

然后从处理角度来看,它是关于添加合适的元数据,以正确的方式丰富信息。对于这种特殊用例,您正在寻找地理位置。您希望确定该特定地图的全球区域是因为,这种地震是因为,这井是为了。您希望提取该信息,以便现在地质学家实际上可以通过位置访问它。他们可以基本上指出地图上的一个地方并说:“在地图上给我所有资产,以便我可以确定我们应该钻取的位置,或者我可以确定井的价值。”

这里重要的另一部分是已经提供的元数据。如果是物质资产,我们的客户正在保留许多关于他们与我们存储的资产的元数据。能够与数字或数字化内容结婚很重要,以便您不会丢失您对这些资产以及潜在的外部来源的任何信息。石油和天然气,也许是IHF数据库等。

能够从机器学习AI透视中获取我们生成的内容,就净新的富集元数据而言,与现有的元数据一起,并且能够在所有这些元数据之间创建这些关系,并且在所有这些资产中都是真正的电力非常迅速地实现那些地球科学家找到合适的东西,并花费大部分时间分析,而且很少试图挑选它们所需的所有信息。

对于石油和天然气来说,还有另一个真正强大的东西,那就是找到类似的图像……也许是地质入侵,这是潜在发现石油的一个伟大迹象。你希望能够找到任何其他的像这样的图像这样你就能在地图上找到你可能想要钻探的好地方。这将是石油和天然气的一个很好的例子,在这种情况下,地下记录。

显然,更快的分析,更好的决定是你在结果方面所期待的。我认为,很明显,还有很多用例需要被淘汰,因为这对石油和天然气行业来说是多么的新鲜。利用图像资产的任何方式,而不是缓慢地拖动一个数字文件或一个物理文件的元数据,并手动查看他们将是新的。

But clearly, if we have that kind of visual data inside a whole bunch of physical locations where we’ve done our drilling, maybe we’ll have an idea of where our higher yield domains might be, and we can allocate our funds in a more efficient manner.

(21:00)你的意思是元数据,可能来自内部或没有?

AC:它可以来自内部;它可以从没有。它可能是您已经在存储库中拥有的元数据;它可能是在购买市场中提供的元数据,可以是公开可用于某些物业的信息。有很多公共信息。实际上,关键是能够在所有这些不同的位和部分之间创建关系,并使其成为附加到资产的元数据的所有部分。

所以现在我知道这张地图涉及全球的某个点,我也知道井的日志来自同一位置,我也知道该点的数据可用。这完全是权力真正添加到元数据并创建该关系,以便您可以通过各种资产类型进行跨越不同的资产,并以有利于快速查找决策的正确信息或您需要回答的问题。

It’s really thinking through what the questions are you’d love to be able to answer, and then backing into, “what kind of information do I need to pull out of the different documents as part of the processing that we do with the machine learning in order to have that?” Or, “where is that information today that I already have? How do I now marry that up with these assets?”

从最后开始,从“我想要回答什么问题?”我希望能够解决什么问题?在这个过程中,我有哪些手动步骤会减慢这个过程?”然后回溯到,“我需要做些什么来加速这个过程,来提供这些信息并回答这些问题?”

(23:30)银行或保险范围内的一些特定用例是什么?

AC:很多和大量银行都有Microfiche,数十年的Microfiche,可能是账户声明的形象。他们采取了所有这些帐户陈述,他们把它放在Microfiche上。对于那些不知道的人,这就像一个具有数百个图像的索引卡大小的Fiche,如针头尺寸图像。

那你为什么想要那东西?因为,很明显,这不是去年或上个月的报表。

它可能是一个地产回到银行说,“嘿,我们认为你欠我们X万美元这个特定的地产。”并且必须能够回溯并产生,例如,几年的陈述。仔细想想,找到合适的缩微胶片,放在合适的盒子里,放在你的缩微胶片阅读器上,在缩微胶片上找到合适的方格,把它数字化,然后再做一次。那是第一个月。希望你只有一页纸的陈述因为如果是两页纸,你在那个特定的月份做了两次。这样做24个月需要很长时间。

顺便说一下,你没有增加任何价值。你所要做的就是响应客户的请求。能够提取所有这些信息,在这种情况下,它实际上是非常具有说明性的,这是非常简单的用例。我希望能够在一堆不同年份的数据中搜索一个帐户号码,并找到一个日期范围的所有相关声明。这是一个非常简单的问题,但是物理缩微胶片很难做到。同样,这在金融服务业非常普遍。

另一个例子是抵押贷款。作为一名顾客,现在很多东西都是数字化的,所以我们可能会认为真的没有太多的纸张涉及了。然而,有时当你在这个过程的最后,你仍然会得到一堆文件。哦,顺便说一下,后端进程通常仍然涉及到字面上的打印东西,并有物理纸的移动。

所以这个过程,首先,需要很长时间。花费的时间比正常的要长,部分原因是有很多人工干预。说真的,你到底想干什么?在流程的前端,您要尝试确定是否拥有决定是否向某人提供贷款所需的所有信息。

这很好地说明了我们如何进行分类和提取?分类回答了第一个问题,即“我是否拥有这个贷款文件中应该包含的所有文件?”

一旦我回答了是或不是,我就进入下一步,也就是,“这些都填得完整准确吗?”我有签名吗,还是我期待有签名?我在这个文件中的所有文件中都有相同的名字和社会保险号吗?我有相同的年利率吗,或者有没有文件有不同的名字,或者名字拼错了,或者社会保险号拼错了,等等?”

在文件中找到信息,即提取。我正在拿出这个名字。我正在拉出社会安全号码。我正在拉出4月。我正在拔出所有这些相关的位和碎片,以便能够回答第二个问题,即它完全准确地填写?你在这里看的是一周到不到一天的过程。在客户体验方面非常强大,所以据推测,我将更快地获得贷款,我的批准更快,也是从实际供应商的明显流程效率的角度来看,在这种情况下。

另一件事是,现在我已经完成了所有这些工作,我有了非常丰富的信息,可以用在次要的方面。例如,我是否遵守公平贷款法律?我现在也能回答这个问题了。在改进了我的过程之后,我现在能够考虑我可以支持的其他次级用例,这样我就可以回答诸如“我是否符合公平贷款法律?”

是的。所有这一切似乎都绑定到你周围的能量中提到的大点,我们真的需要问自己,我们需要问的问题是什么?我们想要启用的过程是什么?因为当你谈到贷款时,为了建立那种那种的东西,当然,我们想知道我们在哪里存储所有这些某些文件,或我们正在寻找的某些类型的术语。为了建立一个可以获得一些东西,就像你所说的那样,可能需要一周时间到一天,我们需要提前做战略思想并建立系统,以便搜索可以在那里工作。

(28:30)一个公司要整合一个人工智能搜索应用需要什么样的战略思维?

AC:你要有正确的人围着桌子和多个感兴趣的潜在早期围着桌子,这样您就可以确保,当你处理所有这些信息,你实际上添加合适的元数据,这样您就可以回答大家的问题。

现在,据说,你肯定可以从最紧迫的或最紧急的东西开始,然后随着时间的推移而开始。所以这不是“我必须立刻思考所有问题”。在我们的示例中,一旦我们为抵押过程所做的这一点,我们可能会实现,我们实际上希望能够回答该合规性问题。

我们基本上可以从处理的角度来细化我们正在做的事情,重新处理我们已经摄取的资产,以添加我们正在寻找的额外元数据。所以你完全可以一点一点来解决最紧迫的问题,政策也是一样。

也许最初你是自动化一个过程。你不是在考虑应用你的保留政策,但你可能想要。Now that I know what I have, I can actually figure out how long I should be keeping it and process it for destruction when I don’t need to keep it anymore so that we start really getting our arms around this big, huge pile of unstructured data. Also, from the perspective of “should I be keeping it anymore?”

如果你认为你想要更广泛的发展,你应该在早期考虑的部分是,“就我需要的工具来说,这意味着什么?”如果我需要跨越实体和数字信息,这意味着什么?如果我需要遍历视频、图像和Office文档,这意味着什么?”

所以没有让自己在你走的角落里,“好的。好吧,我们有我们想要解决的一件事,所以让我们拥有这个非常有针对性的解决方案。“但后来,你转身,你走了,“好的,我很乐意解决下一个问题。”

现在你在看,坦率地说,在一个角落里涂上自己,“很好,我们无法在同一平台上处理视频。”

现在我们推出了第二个,第三个,第三个。因此,重要的是要考虑你可能想要的地方,但你不一定也不一定地用尽一切。You should be thinking about it as a first, second, third, but really do make sure that you understand where you’re ultimately potentially going to want to go so that, as you’re deciding to put in solutions, you’re not narrowing your choices down the line.

订阅我们的AI在行业播客用你最喜欢的播客服务:

itunes-podcast
soundloud-podcast.
Google-Podcast.
Stitcher-Podcast.

本文由铁山赞助,并在与我们的透明方面进行了编写,编辑和公布Emerj赞助的内容指南。通过我们的Emerj广告页面

标题图像信用:Twitter

保持领先于AI曲线

发现关键的人工智能趋势和应用,区分赢家和输家在未来的商业。

注册“AI Advantage”时事通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
保持在机器学习曲线的前面

加入超过20,000名以上的可调性的商业领袖,并收到每周提供的最新的AI研究和趋势。

感谢订阅Emerj的“AI优势”通讯,检查您的电子邮件收件箱确认。