Scikit-learn 的工作原理是什么?

Scikit-learn 主要采用 Python 编写,并使用 NumPy 进行高性能线性代数以及数组运算。一些核心 Scikit-learn 算法则采用 Cython 编写,以提升整体性能。


作为更高级别的库,它包含各种机器学习算法的几种实施,Scikit-learn 让用户仅使用几行代码即可构建、训练和评估模型。


Scikit-learn 还提供一套统一的高级别 API,以供构建 ML 流程或工作流程使用。


在 Scikit-learn ML 流程中,您可以通过转换器传递数据并提取特征,使用估测器生成模型,并使用评估器测量模型的准确性。


Transformer:这是一种转换或输入数据,以进行预处理的算法。

Estimator:这是一种机器学习算法,用于训练或拟合数据,以构建可用于预测的模型。

流程:流程将多个转换器和估测器相连接,从而指定 ML 工作流程。


蓝海大脑 京ICP备18017748号-1