机器/深度学习DeepLearn.js、StarData、TensorFire、DrQA介绍

以下为你介绍的机器学习/深度学习软件都可用在Linux系统上:DeepLearn.js(可实现硬件加速的机器学习 JavaScript 库)、StarData(星际争霸 AI 研究数据集)、TensorFire(基于 WebGL 的浏览器端神经网络框架)、DrQA(开放域问答系统)。

1、DeepLearn.js(可实现硬件加速的机器学习 JavaScript 库)

机器/深度学习DeepLearn.js、StarData、TensorFire、DrQA介绍

DeepLearn.js 是 Google 推出的一个可用于机器智能并加速 WebGL 的开源 JavaScript 库,完全在浏览器中运行,不需要安装,不需要后端处理。

DeepLearn.js 提供高效的机器学习构建模块,使我们能够在浏览器中训练神经网络或在推断模式中运行预训练模型。它提供构建可微数据流图的 API,以及一系列可直接使用的数学函数。

将机器学习带入浏览器有很多好处。一个客户端ML库可以作为交互解释(interactive explanation)的平台,可以快速原型开发(prototyping)和可视化,甚至可以离线计算。撇开其他不谈,浏览器可以说是世界上最受欢迎的编程平台之一。

虽然浏览器上的机器学习库已经存在多年(例如 Andrej Karpathy 的 convnetjs),但是它们受到 JavaScript 速度的限制,或者局限于推理而不能用于训练(例如 TensorFire)。相比之下,deeplearn.js 通过利用 WebGL 在GPU上执行计算,以及进行完全反向传播(full backpropagation)的能力,实现了显着的加速。

这个 API 模拟 TensorFlow 和 NumPy 的结构,具有用于训练的延迟执行模型(像 TensorFlow)和用于推理的即时执行模型(像NumPy)。我们还实现了一些最常用的 TensorFlow 操作版本。伴随着 deeplearn.js 的发布,接下来我们将提供从 TensorFlow checkpoint 导出权重的工具,这将允许作者将它们导入到 deeplearn.js 推理的网页。

你可以通过训练卷积神经网络来识别照片和手写数字来探索这个库的潜力——所有这些都完全不需要编写代码。

机器/深度学习DeepLearn.js、StarData、TensorFire、DrQA介绍

下载地址:https://gitee.com/mirrors/deeplearn-js

2、StarData(星际争霸 AI 研究数据集)

Facebook 发布了一个包含 65646 个星际争霸 replay 的数据集,其中有 15.35 亿帧和 4.96 亿玩家动作。

数据集提供了完整的游戏状态数据以及可在星际争霸中观看的原始 replay。游戏状态数据每三帧记录一次,以确保对更广泛的机器学习任务的适宜性,比如策略分类、反转强化学习、模仿学习、前向建模、部分信息提取等。

开发人员使用 TorchCraft 提取和存储数据,为 replay 和游戏的直接读取标准化了数据格式。此外,数据可被用在不同的操作系统和平台上。数据集仅包含有效、无损坏的 replay,其质量和多样性通过一些启发法来确保。他们通过不同的统计数据说明数据的多样性,并提供了已从数据集中受益的任务实例。

下载地址:https://github.com/TorchCraft/StarData

3、TensorFire(基于 WebGL 的浏览器端神经网络框架)

机器/深度学习DeepLearn.js、StarData、TensorFire、DrQA介绍

TensorFire 是基于 WebGL 的,运行在浏览器中的神经网络框架。使用 TensorFire 编写的应用能够在实现前沿深度学习算法的同时,不需要任何的安装或者配置就直接运行在现代浏览器中。

与之前某些浏览器内的神经网络框架相比,TensorFire 有着近百倍的速度提升,甚至于能够与那些运行在本地 CPU 上的代码性能相媲美。

TensorFire 主要由两部分组成:底层基于 GLSL 的能够高效编写操作四维张量的并行 WebGLS 着色器的编程语言,以及上层的用于导入 Keras 与 TensorFlow 训练好的模型的接口。TensorFire 能够运行在任何的,无论是否支持 CUDA 的 GPU 上;这就意味着,譬如最新的 2016 Retina MacBook Pro 这样的使用 AMD 显卡的机器,也能顺畅地运行 TensorFire。

TensorFire 能够帮助开发者构建不需要用户本地安装的智能应用,并且不同于传统的收集用户数据以统一训练的模式,直接将模型下发到用户端能够保障用户隐私。TensorFire 官方正在着手提供多个范例,譬如复杂的 ResNet-152 网络、著名的基于 RNN 的文本生产与图片着色、基于 SqueeseNet 的物体识别与分类等等。

开发者也可以使用 TensorFire 提供的底层接口来进行其他的高性能计算,譬如 PageRank、元胞自动机仿真、图片转化与过滤等等。

下载地址:https://tenso.rs/

4、DrQA(开放域问答系统)

机器/深度学习DeepLearn.js、StarData、TensorFire、DrQA介绍

DrQA 是 Facebook 开源的开放域(Open-Domain)问答系统,通过阅读理解维基百科,来回答用户的各种问题。

DrQA 主要针对的“机器阅读规模”(MRS)的任务。在这种情况下,我们要在可能非常大的非结构化文档语料库(可能并不冗余)中搜索问题的答案。因此,系统必须将文档检索(查找相关文档)与文本的机器理解(识别这些文档的答案)相结合。

DrQA 使用维基百科作为文档的唯一知识来源。为了回答一个问题,系统必须首先检索超过 500 万篇文章中的少数几篇可能相关的文章,然后再仔细地扫描它们以确认答案。

请注意,DrQA 将维基百科视为文章的一般集合,但不依赖于其内部图形结构。因此,DrQA 可以直接应用于任何文件集合。

运行以下命令以克隆存储库并安装DrQA:

git clone https://github.com/facebookresearch/DrQA.git

cd DrQA; pip install -r requirements.txt; python setup.py develop

下载地址:https://github.com/facebookresearch/DrQA

注明

以上就是机器/深度学习DeepLearn.js、StarData、TensorFire、DrQA的介绍内容,这些机器学习/深度学习软件都能使用在Linux操作系统中。

栏目相关文章