当前访客身份:游客 [ 登录  | 注册加入尚学堂]
启用新域名sxt.cn
新闻资讯

5种方式将机器学习带到Java、Python以及Go等编程语言

helloworld 发表于 2年前  | 评论(0 )| 阅读次数(616 )|   0 人收藏此文章,   我要收藏
摘要 机器学习目前炙手可热,本文搜集了Java、Python以及go等编程语言中常见且实用的开源机器学习工具,对机器学习感兴趣的开发者或者准备和机器学习打交道的数据科学家们不能错过了。

经过几十年作为一门专业学科的发展后,机器学习似乎一夜之间作为万众瞩目的商业工具出现在我们面前。目前面临的挑战是如何让其具备实效,尤其是对开发者和正准备使用它的数据科学家们。

为此,我们搜集了一些最常见的且实用的开源机器学习工具,通过本文分享给大家。

Python

数据科学家们投身Python怀抱是希望有另一种更开放式的选择方案来替代R语言,如今许多雇主寻求大数据专家,而Python就是必需的技能。因此,大量的机器学习软件库开始出现在不断扩大的Python软件名单中。

首先推荐的是 scikit-learn,它能够加载至算法与模块当中,在GitHub(fork版本数量接近2000)上受到了广泛赞赏,并受到了许多科技巨头的青睐。另一个紧随其后的是 PyBrain,它的设计目的在于降低使用难度并提供与其它强大工具相对接的能力。顾名思义,PyBrain的关注重点在于神经网络与非监督式学习,它同时也提供一套用于培训与重新定义算法的机制。

Go

谷歌的系统语言,由于其并行设计,使其似乎是一个编写机器学习库理想的环境。虽然目前与之相关的库项目规模尚小,但也有一些值得关注, GoLearn,它的开发者将其描述为一个“内置电池”的机器学习库。它提供过滤、分类以及回归分析等多种工具。另一套较小且更为基础的库是mlgo,虽然目前它能提供的算法数量还非常少,但计划在未来推出更多。

Java on Hadoop

在人们喜爱的大数据框架中,Mahout(在印地语中意思是“大象骑士”)包含几种常见的机器学习方法。这款软件包是围绕算法而非方法,所以你需要 有一定的算法基础,换言之,如果你足够认真,就肯定不难看出其各部分功能是如何整合在一起的,例如,你可以通过几行代码构建起基于用户的推荐系统。

另一个基于Hadoop的机器学习项目是Cloudera公司推行的Oryx,其特性在于通过交付实时流结果而非处理批量作业来对Mahout处理结果进行进一步分析。该该项目现在还处于初始阶段,注意,这只是个项目而非实际产品,但它在不断改善,所以很值得关注。

Java

除了上述主要针对Hadoop的Mahout,其他一些面向Java的机器学习库也在广泛使用。 Weka由新西兰怀卡托大学开发的工作台式的应用,它在常见的算法集合中增加了可视化和数据挖掘功能。对于那些想要为他们的工作打造一个前端或者计划将Java作为初始开发的用户来说,Weka可能是最好的选择。 Java-ML也不错,但它更适合那些已经习惯将Java和机器学习配合使用的开发者。

JavaScript

关于JavaScript的笑话(“阿特伍德定律”),原意是这样的,任何能够由JavaScript编写的内容最终都会由JavaScript编 写,这对机器学习库同样适用。目前由JavaScript编写的方案在这一领域数量仍然相对较少,大多数选项仅仅是单一算法而非完整的库,但已经有部分有 用工具渐渐脱颖而出。 ConvNetJS允许大家直接在浏览器当中进行深度学习神经网络培训,而名为 brain则将神经网络作为可安装的NPM模块提供给大家。此外, Encog库同样值得关注,而且它适用于多种平台:Java、C#、C/C++以及JavaScript。

原文链接: 5 ways to add machine learning to Java, JavaScript, and more
分享到:0
关注微信,跟着我们扩展技术视野。每天推送IT新技术文章,每周聚焦一门新技术。微信二维码如下:
微信公众账号:尚学堂(微信号:bjsxt-java)
声明:博客文章版权属于原创作者,受法律保护。如果侵犯了您的权利,请联系管理员,我们将及时删除!
(邮箱:webmaster#sxt.cn(#换为@))
北京总部地址:北京市海淀区西三旗桥东建材城西路85号神州科技园B座三层尚学堂 咨询电话:400-009-1906 010-56233821
Copyright 2007-2015 北京尚学堂科技有限公司 京ICP备13018289号-1 京公网安备11010802015183