微软Azure的NLP人工智能服务的新内容
微软终于接近于交付其长期承诺的自然用户界面,以下是你如何在你的代码中构建它们:
如果你想在你的应用程序中开始使用机器学习,微软提供了几种不同的方式来启动开发。其中一项关键技术,即微软的Azure认知服务,提供了一套具有预训练模型和REST API端点的管理型机器学习服务。这些模型提供了大多数常见的用例,从处理文本和语言,到识别语音和图像。
机器学习仍在不断发展,新的模型被发布,新的硬件帮助加快推理速度,因此微软定期更新其认知服务。在Build 2022上宣布的最新重大更新,对其处理文本的工具进行了大量修改,将三个不同的服务归入一个伞下。过去,文本分析、QnA Maker和LUIS语言理解是独立的工具,现在它们是一套自然语言处理工具的一部分,帮助你处理存储的数据和实时用户输入。
引入语言认知服务
现在的品牌是Cognitive Service for Language
,这些工具让你可以访问熟悉的功能(在迁移到新的API之后)和新服务。迁移可能很复杂,因为两个版本的一些服务之间存在着突破性的变化。你现在可以继续使用旧的API,但对于新的应用和现有代码的更新,值得调查新的服务。
LUIS配置文件可以创建新的对话式语言理解项目,尽管有些实体不被支持。这将影响已经定制的模型。虽然微软建议其新的语言模型不需要这些定制,但如果你发现新服务的问题,值得监测应用程序的性能并与新的API合作。
如果你已经使用了QnA Maker知识管理服务,你可能会发现最好从相同的源材料创建新的自定义问题回答服务。你可以在服务之间复制知识库,以引入以前学过的建议,但在实践中,底层模型有足够的变化,重新开始可能更可取。
Cognitive Service for Language包含了一些
原始平台中没有的新功能。其中一些对企业应用特别有用,因为它们有助于自动处理复杂的监管场景,即用户正在输入自由格式的文本(如在聊天或电子邮件中),而你需要存储这些互动。
自动识别和编辑PII
对于任何处理个人身份信息的应用程序来说,有一个新功能应该是一个快速的胜利。PII在大多数司法管辖区受到高度监管,但用户在电子邮件或聊天中包含信用卡细节或社会安全号码是很常见的。如果你要归档内容,就需要对这些内容进行编辑,Azure Cognitive Service for Language中的PII识别工具
可以帮助识别这些数据。
和大多数Azure服务一样,使用PII检测工具是将其嵌入你的应用工作流程中
。首先创建一个Azure语言资源,它将承载你的服务端点,并为服务生成适当的密钥。现在你可以访问PII识别服务的REST API,直接使用熟悉的HTTPS调用JSON数据来处理它。另外,还有一些适用于大多数常见语言和平台的SDK,它们将API调用包装成方法,为你处理访问、请求和响应。
如果你使用Python,微软为其文本分析工具提供了一个客户端库,可以通过管道安装。一旦安装,该库可以发出你的访问密钥,并创建一个访问PII识别端点的客户端对象。你需要为你旨在编辑的PII提供文本,例如,可能包含SSN、信用卡号码或电话号码的内容,系统会返回一个带有编辑数据和一组信心分数的文本对象。
这些帮助你自动编辑非结构化文件,根据你的样本文件对编辑工作进行分类。该服务可以识别一组常见的实体类型:姓名、电话号码、地址(物理和电子邮件)、数字标识符,如产品密钥或银行账户号码,以及信用卡详细信息。
如果你在对话中使用这个工具,例如,作为聊天机器人的一部分,你可以使用另一个API来分析PII的对话项目列表
,以异步方式返回数据。这意味着你不能实时编辑数据;相反,它的目的是在归档之前处理整个聊天记录,为你的应用工作流程增加一个编辑步骤。它甚至可以处理公认的PII语音,确保转录本不包含敏感信息,同时提供时间码以允许音频编辑。对话式PII API的每次调用将包含一个单一对话的文件。目前,您在这项服务中只限于使用英语。
从聊天中协调工作流程
微软继续扩大其认知服务中的可用工具,随着它推出新的模型,每月都会增加新的功能。最近进入普遍可用性的一个工具允许你通过使用对话式机器学习API
从内容中提取信息,然后将其传递给正确的服务,来协调多个服务的工作流程。
这种方法需要一个从定义意图和行动的标记数据中训练出来的自定义模型。你在Language Studio中建立模型
,这是一个Azure门户,提供训练和测试模型的工具。你将从一个连接到对话式语言理解项目的模式开始。一旦经过训练,协调模型就可以用来将数据从聊天机器人路由到适当的服务。
例如,你可以有一个人力资源自助服务机器人,它可以识别你是在问一个需要传递给人力资源知识库的问题,还是在请求休假,在这种情况下,它会提取日期并将它们转发给一个休假日历请求应用程序。像这样的工作流程是非正式的,在微软团队中运行的聊天机器人将允许员工快速访问服务,而不干扰其他任务。
可以发送至语言服务的文件大小有限制。你一次可以向PII识别API发送五个文件,速率限制由你的订阅级别设定。一个文档在同步编辑时只能有5120个字符,在异步请求中的所有文档可以有125000个字符和1MB。你可以使用标准的字符串信息调用来获取文档的大小,然后再将它们发送到服务中,必要时对内容进行分块。
一个自然语言界面
微软将构成新的语言认知服务的不同服务捆绑在一起是有意义的。把它们包括在一个智能工作流路由引擎中,有助于把服务粘在非正式的、非结构化的对话的背景中。聊天机器人和其他内容驱动的服务往往是单一目的和不灵活的,而用户期望有一个对话环境,可以支持多种任务,同时还能保护他们的隐私。
随着我们在组织内部和外部实现越来越多类似服务台的自动化,为知识库和应用程序提供一个智能接口变得越来越重要。我们需要与用户的期望相匹配,而像这样的工具提供了一个脚手架,以提供自动化的系统,让人感觉不到自动化,并能对我们的非正式沟通方式作出反应。这是一种看待用户界面开发的有趣方式。这个工具更接近于微软在过去十年大部分时间里一直倡导的自然用户界面。
Be First to Comment