使我们的API的功能适应您的方案,以在分析中获得最大的准确性

含义Cloud具有一组自定义工具,允许用户将API的功能调整到其方案中以一种简单的方式,没有编程。它们能够创建特定领域的词典和模型,以在执行信息提取,分类或情感分析时提供最佳的精度和回忆。

文本分析质量:精确和回忆

文本分析API并不完美。鉴于语言的含糊不清,对人类专家进行的文本的分析也不是完美的 - 人类注释者之间的巧合百分比不超过85-95%。

分析的质量或准确性通常是根据精确(相关的检测因素的数量)和记起(检测到的相关元素的数量)。通常,考虑到一定的分析技术,精度和召回是对立的:一个改进可能会使另一个恶化,反之亦然。因此,关键是要在两者之间找到对应用程序最佳的权衡。

例如,在社交媒体中的品牌声誉监控的应用程序中,即使召回率很低,高精度也可能是一个优先事项(分析在方向上是正确的,尽管某些评论可能没有bob体育平台二维码注意到)。相反,尽管精确度较低(手动监视错误的警报),但反恐应用可能需要高召回(没有丢失)。

为什么要自定义API?

文本分析系统的质量取决于所采用的技术和算法以及纳入语言资源(本体,模型)。例如,如果某个实体未包含在用于提取主题的资源中,则几乎无法检测到。或者,如果您想确定提及公司的哪个部门,则文本分类模型应具有代表每个部门的特定类别。

而且,当然,标准产品不可能将任何可能的应用程序的所有主题,主题等包括在其资源中。在每种情况下纳入必要的语言资源允许在分析中获得最佳质量得分。这就是含义Cloud的自定义工具的目的。

一个例子

想象一下需要分析与金融服务公司相关的客户反馈的用户。也许本体论或某些通用词典不会以足够的深度和范围(就产品,人,主题等而言)覆盖该行业,因此相关的提及,主题或观点可能不会引起人们的注意。bob体育开户

有必要用以下方式补充这些一般资源:

  • 此类行业中最相关的公司,产品,高管等的名称,以准确监视它们。bob体育开户
  • 产品类别的分类法(存款,抵押,帐户等)或交互渠道(办公室,电话,网络),能够对对话进行分类。
  • 不同用途和环境中各种术语的正/负/中性极性,例如“利率很高”的表达可能是指沉积物,但如果涉及抵押,则为负。

含义Cloud的自定义工具

为了解决这类方案,含义Cloud具有完整的自定义工具曲目,可将不同API的功能调整到用户的域。

字典

创建在本体中连接的新实体和概念,以便能够检测文本中的外观。

分类模型

创建新的分类法和训练/配置分类引擎,以根据它们对文本进行分类。

情感模型

当单词(或单词组)出现在不同的上下文中并扮演不同的角色以使情绪分析适应您的域时,定义了它们的极性。

深度分类模型

创建新的分类法和配置引擎,以基于语义分析对文本进行高粒度和准确性分类。

这些自定义功能基于意义上强大的自然语言处理技术。

字典

字典管理工具允许创建新的实体和概念为他们分配语义信息并在本体中连接它们。创建字典后,含义cloud API如主题提取,诱饵,pos和解析以及情感分析可以在文本中识别这些元素并提取它们,从而返回相关的语义信息。

分类模型

分类模型管理工具让您创建分类学(由类别的层次结构组成)和构建分类楷模为他们。这样,文本分类API可以根据此类类别对文本进行分类。在类别的定义和对其进行分类的模型的创建中,含义应用了两种技术:

  • 一个基于培训文本和机器学习,通过将每个类别的一组示例文本提供给工具,以便系统可以自动生成分类模式。
  • 另一个基于规则的配置,其中指定文本中必须出现的术语,不应出现的术语,增加了文本相关性与降低这种相关性的类别和术语的相关性。

这种技术(培训和规则)的组合使得统计方法的快速实施与规则的高精度相结合。

情感模型

情感模型管理工具能够在特定的应用程序场景中定义单词的极性(正,负,中性...)。与市场上可用的其他技术基本上定义了具有正极或负极性的“单词袋”的技术不同,这种意义上的工具远远超出了:

  • 将单词的作用定义为极性向量(容器,否定器,修饰符),允许使用引理轻松地结合每个单词的可能变体
  • 根据单词的极性指定特定情况,具体取决于其出现的上下文或在每种情况下的句法函数
  • 将多单词表达式定义为极性评估中的优先元素
  • 管理这些个人极性模型如何补充或替换每种语言的一般模型。

使用该工具定义的情感模型可以使用,以便情感分析API可以根据它们评估极性。

深度分类模型

深层分类模型管理工具允许创建分类学(由类别的层次结构组成)并构建楷模使用其形态句法和语义分析,将文本具有很高的粒度和准确性分类。为此,该工具包含一个语义规则语言能够定义功能强大的高级表达式,以利用各种类型的运营商来利用单词的详细标记。所有这一切不需要大型训练集,与其他技术不同。结果是模型非常强大,准确且易于完善,并且由深层分类API使用。

用户自主权

这些工具为用户提供的主要好处是开发其自定义文本分析系统的自主权。其他提供商要求其专业服务(通常昂贵)的参与才能对其API进行基本改编。

相反,含义Cloud的工具为用户提供了自主权(以一种简单的方式)开发的自主权,并且没有编程 - 适合其需求的强大分析引擎,从而确保了最高质量。