Pylearn2:一个基于Theano的机器学习库
当前位置:以往代写 > 其他教程 >Pylearn2:一个基于Theano的机器学习库
2019-06-14

Pylearn2:一个基于Theano的机器学习库

Pylearn2:一个基于Theano的机器学习库

本资源由 伯乐在线 – 赵叶宇 整理

pylearn2

Pylearn2是一个基于Theano的机器学习库,它的大部分功能是基于Theano顶层实现的。这意味着用户可以用数学表达式去编写Pylearn2插件(新模型、算法等),Theano不仅会帮助用户优化这些表达式,并且将这些表达式编译到CPU或者GPU中。

功能特性

  • 研究人员可以添加他们所需要的功能。我们避免提前设置过多自上而下的计划,这样容易导致用户难以使用。
  • 一个实现高效科学实验的机器学习工具箱。
  • LISA实验室发布的所有模型/算法都应该在Pylearn2中具有引用说明。
  • Pylearn2可能会引用其他库,如scikit-learn。
  • Pylearn2与scikit-learn的不同之处在于Pylearn2旨在提供极大的灵活性,使得研究人员可以自行实现任何事情。而scikit-learn旨在作为一个“黑箱”,即使用户对算法底层实现没有了解也可以输出实验结果。
  • 包括了矢量,图像,视频等数据集接口。
  • 一个针对普通MLP/RBM/SDA/卷积实验所有需要内容的小型框架。
  • 易于重复使用Pylearn2的子组件。
  • 使用Pylearn2库的一个子组件不会强制用户使用/学习使用所有其他子组件,用户可以自行选择。
  • 支持跨平台序列化学习模型。
  • 十分简单易用(蒙特利尔大学的IFT6266)。
  • 下载与安装

    目前没有PyPI安装包,所以Pylearn2不能用pip命令来进行安装。用户必须使用如下命令从GitHub上下载:

    Shell

    1 git clone git://github.com/lisa-lab/pylearn2.git

    为了让Pylearn能够在用户安装的Python中使用,请在pylearn2顶层目录中执行如下命令:

    Shell

    1 python setup.py develop

    用户可能需要使用sudo来以管理员身份执行这条命令。如果您无法获得该权限(或者因为任何原因不能添加Pylearn2到site-packages中),您可以使用如下命令来安装在user site-packages directory中的相应链接。

    Shell

    1 python setup.py develop –user

    您还可以使用其他安装方式,可以将安装目录添加到本地PYTHONPATH环境变量中来安装Pylearn2。

    数据存储路径

    在一些教程或者测试中,用户需要设置PYLEARN2_DATA_PATH变量。在Linux系统中,最好的方式是将下面这行代码添加到~/.bashrc文件中:

    1 export PYLEARN2_DATA_PATH=/data/lisa/data

    #p#分页标题#e#

    请注意上面只是一个例子,如果用户不在LISA lab中,则需要选择本地文件系统中有效的目录路径。尽量选择方便您存储数据的目录。

    其他方法

    Vagrant(任何操作系统)

    Pylearn2 in a box使用Vagrant能够很容易地创建出一个安装Pylearn2和所需包的虚拟机。

    快速开始

    pylearn2/scripts/tutorials/grbm_smd/目录中包含了一个如何使用pylearn2训练模型的例子。 在这个模型中,一共分为三个步骤。首先,我们创建一个预处理后的数据集并将它存储在文件系统中。接着在这些数据集上使用train.py脚本来训练模型。最后我们可以检验模型,了解模型学习实验是如何运行的。

    第一步:创建数据集

    在grbm_smd目录中,执行下列语句:

    Shell

    1 python make_dataset.py

    创建数据集需要消耗一些时间。

    第二步:训练模型

    在grbm_smd目录中,执行下列语句:

    Shell

    1 train.py cifar_grbm_sm.yaml

    这条命令执行后会生成一个cifar_grbm_smd.pkl的文件。

    第三步:检验模型

    在grbm_smd目录中,执行下列语句:

    Shell

    1 show_weights.py cifar_grbm_smd.pkl

    执行这条命令后,一个包含过滤器的窗口将会出现。 现在关闭这个窗口,执行下列语句:

    Shell

    1 plot_monitor.py cifar_grbm_smd.pkl

    命令执行后会弹出一个简单的界面,将训练模型过程中跟踪的不同数据进行了可视化。尝试输入b,L,M并按回车键显示目标函数和重建误差的图像。完成后,关闭图像并输入q退出。

    其它相关库

  • 使用Pylearn需要依赖于Theano和其他依赖库。
  • 大多数功能需要用到PyYAML。
  • 一些与图像相关的功能需要用到PIL。
  • 一些画图功能需要用到matplotlib.
  • 还有一些可选库供用户选择。
  • 文档

  • 快速开始例子 – 通过例子开始学习。
  • YAML for Pylearn2 – Pylearn2中YAML标签的使用教程。
  • IPython Notebook Tutorials – 用户可以通过ipython notebooks在“scripts/tutorials”目录工作。
  • Pylearn2中的第一个实验 – 关于实验的简要介绍。
  • 在Pylearn2中监测实验 – 实验监测概述。
  • Pylearn2中的模型 – 如何将Theano代码移植到Pylearn2中。
  • 特性 – Pylearn2中一系列特性介绍。
  • 概述 – 一个关于Pylearn2如何工作的详细而全面的介绍,如果你想要真正了解这个库,可以从这里开始学习。
  • 模块文档 – Pylearn2中模块的文档。
  • 在计算机集群中使用 – 在LISA中使用的能够让Pylearn2运行在HPC集群中的工具。
  • 如何在Pylearn2中处理超大数据集 – Pylearn2处理超大数据集的向导。
  • Pylearn2 Vision – Pylearn2的一些详细描述。
  • F.A.Q – 常见问题解答。
  • 社区与开发者

  • 如果用户想要和其他用户进行讨论或者需要咨询问题,可以在pylearn-users进行发布。
  • 如果想要获取最新更新的邮件通知,可以登录pylearn2-github。
  • 开发者手册 – 如何加入Pylearn2的开发者行列。
  • 开发资源链接

  • stackoverflow相关问题
  • Youtube教学视频
  • Pylearn2中Quick-start例子总结
  • 使用Pylearn2来解决回归问题
  • 官方网站:http://deeplearning.net/software/pylearn2
    开源地址:http://github.com/lisa-lab/pylearn2

     

      关键字:

    在线提交作业


      关键字:

    在线提交作业