自然语言处理Transformers、Clause、Icecaps、DELTA介绍

以下为你介绍的自然语言处理软件都可用在Linux系统上:Transformers TF-PT(用于 TF 2.0 和 PyTorch 的自然语言处理框架)、Clause(语义理解系统)、Icecaps(智能会话引擎)、DELTA(自然语言理解模型训练平台)。

1、Transformers(用于 TF 2.0 和 PyTorch 的自然语言处理框架)

自然语言处理Transformers、Clause、Icecaps、DELTA介绍

Transformers(以往称为 pytorch-transformers 和 pytorch-pretrained-bert)是用于 TensorFlow 2.0 和 PyTorch 的自然语言处理框架。它提供了用于自然语言理解(NLU,Natural Language Understanding)和自然语言生成(NLG,Natural Language Generation)的最先进的通用架构,包括 BERT、GPT-2、RoBERTa、XLM、DistilBert 与 XLNet 等,具有超过 100 种语言的 32 种以上经过预训练的模型,以及 TensorFlow 2.0 和 PyTorch 之间的深度互操作性。

特性:

与 pytorch-transformers 一样易用。

像 Keras 一样强大与简洁。

处理 NLU 和 NLG 任务时性能高。

教育者和从业者的进入门槛低。

低计算成本,研究人员可以共享训练模型,不必再训练,内置 8 种架构,包含 30 多种预训练的模型,其中一些采用 100 多种语言。

3 行代码即可训练最先进的模型。

TensorFlow 2.0 和 PyTorch 模型之间的深层互操作性,可以随意在两个框架之间移动单个模型。

安装命令:

首先,您需要安装TensorFlow 2.0和PyTorch中的一个或两个。当安装了TensorFlow 2.0或PyTorch时,可以使用pip命令安装:

pip install transformers

下载地址:https://github.com/huggingface/transformers

2、Clause(语义理解系统)

自然语言处理Transformers、Clause、Icecaps、DELTA介绍

Clause 是帮助中小型企业快速而低成本地获得好用的语义理解服务的系统。Clause 为实现企业聊天机器人提供强大的大脑,包括客服、智能问答和自动流程服务,其利用深度学习、自然语言处理和搜索引擎技术,让机器更加理解人。

Clause 的服务端使用 C++编写,并且发布为 Docker 镜像;同时提供的客户端集成接口支持多种语言,包括 Java、Python、Node.js 等。

下载地址:https://github.com/chatopera/clause

3、Icecaps(智能会话引擎)

自然语言处理Transformers、Clause、Icecaps、DELTA介绍

随着自然语言处理的迅速普及,越来越多的工具为公众提供了构建大型系统的工具。其中一些工具用于通用 NLP,而其他工具则侧重于特定领域,如语言建模和文本生成。然而,很少被设计为针对会话情景及其所带来的具体需求。

Icecaps 是一个用于构建神经对话系统的开源工具包。重点是对话建模,通过强调灵活性、模块化和易用性的设计,icecaps 使用户能够构建定制的神经会话系统,从而产生个性化、多样化和知情的响应。

特性:

1]、Icecaps 的设计基于组件链体系结构,其中模型被表示为数据通过的组件链(例如编码器和解码器)。这使得具有任务间共享组件的复杂多任务学习环境成为可能。

2]、个性化嵌入、空间融合和基于 MRC 的知识基础模型。

3]、提供定制的解码工具,允许用户使用最大限度的互通信息、令牌过滤和重复惩罚来提高响应质量和多样性。

4]、数据处理工具为用户提供了方便地将其文本数据集转换为二进制 TFRecord 的工具。数据处理器具有多种文本预处理工具,包括字节对编码和固定长度的多转角上下文提取。

icecaps 是针对 Python 环境的,构建在 TensorFlow 之上。建议在带有 Python3.7 的 Anaconda 环境中使用icecaps。创建环境后,运行以下命令来安装所有必需的依赖项:

pip install -r requirements.txt

如果您的计算机具有GPU,建议您改为从requirements-gpu.txt安装。

下载地址:https://github.com/microsoft/icecaps

4、DELTA(自然语言理解模型训练平台)

自然语言处理Transformers、Clause、Icecaps、DELTA介绍

滴滴正式宣布开源基于深度学习的语音和自然语言理解模型训练平台 DELTA,以进一步帮助 AI 开发者创建、部署自然语言处理和语音模型,构建高效的解决方案,助力 NLP 应用更好落地。

DELTA 主要基于 TensorFlow 构建,能同时支持 NLP(自然语言处理)和语音任务及数值型特征的训练,整合了包括文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,形成一致的代码组织架构,整体包装统一接口。

用户准备好模型训练数据,并指定好配置 Configuration,模型训练 pipeline 可以根据配置进行数据处理,并选择相应的任务和模型,进行模型训练。在训练结束之后,自动生成模型文件保存。该模型文件形成统一接口,可以直接上线使用,快速产品化,能让从研究到生产变得更容易。

值得注意的是,除可支持多种模型的训练,DELTA 还支持灵活配置,开发者可基于 DELTA 搭建成多达几十种的复杂的模型。此外,DELTA 在多种常用任务上提供了稳定高效的 benchmark,用户可以简单快速的复现论文中的模型的结果,同时也可以在此基础上扩展新的模型。在模型构建完成后,用户可以使用 DELTA 的部署流程工具,迅速完成模型上线。从论文到产品部署无缝衔接。

下载地址:https://github.com/didi/delta

注明

以上就是自然语言处理Transformers、Clause、Icecaps、DELTA的介绍内容,这些自然语言处理软件都能使用在Linux操作系统中。

栏目相关文章