Pylearn2:一个基于Theano的机器学习库
本资源由 伯乐在线 – 赵叶宇 整理
Pylearn2是一个基于Theano的机器学习库,它的大部分功能是基于Theano顶层实现的。这意味着用户可以用数学表达式去编写Pylearn2插件(新模型、算法等),Theano不仅会帮助用户优化这些表达式,并且将这些表达式编译到CPU或者GPU中。
功能特性
下载与安装
目前没有PyPI安装包,所以Pylearn2不能用pip
命令来进行安装。用户必须使用如下命令从GitHub上下载:
Shell
1 | git clone git://github.com/lisa-lab/pylearn2.git |
为了让Pylearn能够在用户安装的Python中使用,请在pylearn2
顶层目录中执行如下命令:
Shell
1 | python setup.py develop |
用户可能需要使用sudo
来以管理员身份执行这条命令。如果您无法获得该权限(或者因为任何原因不能添加Pylearn2到site-packages
中),您可以使用如下命令来安装在user site-packages directory中的相应链接。
Shell
1 | python setup.py develop –user |
您还可以使用其他安装方式,可以将安装目录添加到本地PYTHONPATH
环境变量中来安装Pylearn2。
数据存储路径
在一些教程或者测试中,用户需要设置PYLEARN2_DATA_PATH
变量。在Linux系统中,最好的方式是将下面这行代码添加到~/.bashrc
文件中:
1 | export PYLEARN2_DATA_PATH=/data/lisa/data |
#p#分页标题#e#
请注意上面只是一个例子,如果用户不在LISA lab中,则需要选择本地文件系统中有效的目录路径。尽量选择方便您存储数据的目录。
其他方法
Vagrant(任何操作系统)
Pylearn2 in a box使用Vagrant能够很容易地创建出一个安装Pylearn2和所需包的虚拟机。
快速开始
pylearn2/scripts/tutorials/grbm_smd/
目录中包含了一个如何使用pylearn2训练模型的例子。 在这个模型中,一共分为三个步骤。首先,我们创建一个预处理后的数据集并将它存储在文件系统中。接着在这些数据集上使用train.py
脚本来训练模型。最后我们可以检验模型,了解模型学习实验是如何运行的。
第一步:创建数据集
在grbm_smd目录中,执行下列语句:
Shell
1 | python make_dataset.py |
创建数据集需要消耗一些时间。
第二步:训练模型
在grbm_smd目录中,执行下列语句:
Shell
1 | train.py cifar_grbm_sm.yaml |
这条命令执行后会生成一个cifar_grbm_smd.pkl
的文件。
第三步:检验模型
在grbm_smd目录中,执行下列语句:
Shell
1 | show_weights.py cifar_grbm_smd.pkl |
执行这条命令后,一个包含过滤器的窗口将会出现。 现在关闭这个窗口,执行下列语句:
Shell
1 | plot_monitor.py cifar_grbm_smd.pkl |
命令执行后会弹出一个简单的界面,将训练模型过程中跟踪的不同数据进行了可视化。尝试输入b,L,M并按回车键显示目标函数和重建误差的图像。完成后,关闭图像并输入q退出。
其它相关库
文档
社区与开发者
开发资源链接
官方网站:http://deeplearning.net/software/pylearn2
开源地址:http://github.com/lisa-lab/pylearn2