机器/深度学习KPRN、SQLFlow、fklearn、fastai介绍

以下为你介绍的机器学习/深度学习软件都可用在Linux系统上:KPRN(知识图谱路径的推荐模型)、SQLFlow(赋予 SQL AI 能力)、fklearn(机器学习第三方模块)、fastai(深度学习实践库)。

1、KPRN(知识图谱路径的推荐模型)

KPRN 由 eBay 开源,是一个知识图谱路径的推荐模型(Reasoning Over Knowledge Graph Paths for Recommendation)。它广泛使用机器学习技术,有助于媒体等项目对推荐属性进行训练和预测,运行环境需配置 Python(2.7/3.5) 和 Lua(5.3)。

KPRN 是在 AAAI 2019 会议发表论文 "Explainable Reasoning over Knowledge Graphs for Recommendation." 的关联代码。该论文提出了一种基于 RNN 的推荐模型,对用户和物品之间的交互特征在知识图谱中存在的关联路径进行建模,为用户提供可解释性推荐。这个模型基于 LSTM 学习关联路径的表示,充分考虑了实体、关系间产生的序列依赖性,具备较强的推理能力。数据显示,该模型在电影数据集 MI 音乐数据集 KKBox 上取得了当前最优结果。

下载地址:https://github.com/eBay/KPRN

2、SQLFlow(赋予 SQL AI 能力)

机器/深度学习KPRN、SQLFlow、fklearn、fastai介绍

SQLFlow 将 SQL 与 AI 结合在一起,扩展了 SQL 语言,使其支持模型训练、预测和推理。它可以连接 MySQL、Hive、SparkSQL 与 SQL Server 等 SQL 引擎,并带有 TensorFlow 和其它机器学习工具包。

1]、此解决方案兼容许多 SQL 引擎,而不是与特定版本或类型兼容。

2]、支持复杂的机器学习模型,包括用于深度学习的 TensorFlow 和用于树的 xgboost。

3]、灵活地配置和运行尖端的 ML 算法,包括指定特征交叉,至少不包含嵌入在 SQL 语句中的 Python 或 R 代码,以及与超参数估计完全集成。

目前支持 MySQL 与 TensorFlow,正在扩展到 Apache Hive、阿里巴巴 ODPS 和 PyTorch。

快速概述:

以下是使用样本数据Iris.train训练Tensorflow DNNClassifer模型以及使用训练后的模型进行运行预测的示例,您可以看到使用SQL编写一些ML代码:

sqlflow> SELECT *

FROM iris.train

TRAIN DNNClassifier

WITH model.n_classes = 3, model.hidden_units = [10, 20]

COLUMN sepal_length, sepal_width, petal_length, petal_width

LABEL class

INTO sqlflow_models.my_dnn_model;

...

Training set accuracy: 0.96721

Done training

sqlflow> SELECT *

FROM iris.test

PREDICT iris.predict.class

USING sqlflow_models.my_dnn_model;

...

Done predicting. Predict table : iris.predict

下载地址:https://github.com/sql-machine-learning/sqlflow

3、fklearn(机器学习第三方模块)

fklearn 采用函数式编程原理,让机器学习更容易解决实际的问题(项目名字致敬了广为人知的 scikit-learn 库)。

fklearn 的原理:

1]、确认(Validation)应反映真实环境。

2]、生产模型(production models)应该与经过确认的模型相匹配。

3]、模型应该是生产就绪(production-ready)的,只需要少数额外步骤。

4]、模型结果的再现性和深入分析应该很容易实现。

安装:

通过pip安装:

pip install fklearn

您也可以从源代码安装:

git clone git@github.com:nubank/fklearn.git

cd fklearn

git checkout master

pip install -e .

下载地址:https://github.com/nubank/fklearn

4、fastai(深度学习实践库)

机器/深度学习KPRN、SQLFlow、fklearn、fastai介绍

fastai库使用现代最佳实践简化了快速准确的神经网络训练。它基于对fast.ai深度学习最佳实践的研究,包括对vision,text,tabular和collab(协作过滤)模型的“开箱即用”支持。

如果您正在寻找源代码,请访问GitHub上的fastai repo。有关简要示例,请参阅示例文件夹,完整文档中提供了详细示例。

例如,以下是如何使用resnet18训练MNIST模型(来自vision example):

path = untar_data(URLs.MNIST_SAMPLE)

data = ImageDataBunch.from_folder(path)

learn = cnn_learner(data, models.resnet18, metrics=accuracy)

learn.fit(1)

PyPI安装:

pip install fastai

默认情况下,pip将使用最新的cudatoolkit安装最新的pytorch,如果您的硬件不支持最新的cudatoolkit,请安装适合您硬件的pytorch构建。

错误修复安装:

如果在git中进行了错误修复,则可以使用以下方法安装fastai的最新版本:

pip install git+https://github.com/fastai/fastai.git

下载地址:https://github.com/fastai/fastai

注明

以上就是机器/深度学习KPRN、SQLFlow、fklearn、fastai的介绍内容,这些机器学习/深度学习软件都能使用在Linux操作系统中。

栏目相关文章