关于python

python 以优雅简洁明确为主。“人生苦短,我用python”。python的开发哲学是用一种方法,最好是只有一个方法来解决一件事情。在机器学习领域首先语言就是python。

语法简单,功能强大生态完整,具备丰富的第三方库。

numpy

矩阵计算 一个强大的N维数组对象Array 用于整合C/C++和Fortran代码的工具包;

Scipy

SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包,它包括统计、优化、整合、线性代数模块、傅里叶 变换、信号和图像处理、常微分方程求解器等等。

NLTK

NLTK在NLP领域中是最常使用的一个Python库

scikit-Learn

Scikit-Learn是基于Python的机器学习模块

tensorflow

TensorFlow是一个采用数据流图、用于数值计算的开源软件库。

pytorch

Facebook 开源的深度学习框架目前比tensorflow应用更加的广泛。

特征工程

数值类特征工程