机器/深度学习Orange Data Mining、Milepost GCC、Apache Mahout介绍

以下为你介绍的机器学习/深度学习软件都可用在Linux系统上:Orange Data Mining(数据挖掘和机器学习软件)、Milepost GCC(开源机器学习编译器)、Apache Mahout(机器学习库)。

1、Orange Data Mining(数据挖掘和机器学习软件)

机器/深度学习Orange Data Mining、Milepost GCC、Apache Mahout介绍

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。

下载地址:https://github.com/biolab/orange2

2、Milepost GCC(开源机器学习编译器)

Milepost GCC 是IBM发布的世界上第一款开源机器学习编译器。

IBM称编译器能智能的优化程序,因此能缩短开发时间,同时又能提升性能。使用机器学习技术,编译器分析软件,确定哪些代码优化将能在编译中取得最大的效率。对IBM System p服务器的初步试验显示,嵌入式软件性能平均提高了18%。新的编译器预计将减少新软件上市时间,因为原来由开发者手动优化的工作可以全都交给编译器完成。一个基于Wiki的社区cTuning.org也与编译器一同发布。网站主要功能是使用统一的API开发开源工具,分享有趣的优化案例,展开协作式研究。

下载地址:http://www.milepost.eu/

3、Apache Mahout(机器学习库)

机器/深度学习Orange Data Mining、Milepost GCC、Apache Mahout介绍

项目简介:Apache Mahout(TM)是一个分布式线性代数框架,具有数学表达力的Scala DSL,旨在让数学家、统计学家和数据科学家快速实现自己的算法,建议使用Apache Spark开箱即用的分布式后端,也可以将其扩展到其他分布式后端。优点:数学表达式Scala DSL、支持多个分布式后端(包括Apache Spark)、模块化本地求解器CPU/GPU/CUDA加速。

Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经取得了一些进展。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

Mahout 项目是由 Apache Lucene(开源搜索)社区中对机器学习感兴趣的一些成员发起的,他们希望建立一个可靠、文档翔实、可伸缩的项目,在其中实现一些常见的用于集群和分类的机器学习算法。该社区最初基于 Ngetal. 的文章 “Map-Reduce for Machine Learning on Multicore”,但此后在发展中又并入了更多广泛的机器学习方法。

Mahout 的目标还包括:

1]、建立一个用户和贡献者社区,使代码不必依赖于特定贡献者的参与或任何特定公司和大学的资金。

2]、专注于实际用例,这与高新技术研究及未经验证的技巧相反。

3]、提供高质量文章和示例。

下载地址:http://mahout.apache.org/

注明

以上就是机器/深度学习Orange Data Mining、Milepost GCC、Apache Mahout的介绍内容,这些机器学习/深度学习软件都能使用在Linux操作系统中。

栏目相关文章