sklearn.linear_model.LinearRegression

class sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=1)

线性回归参数：

fit_intercept：布尔值，默认为true

说明：是否对训练数据进行中心化。为false，表明输入的数据已经进行了中心化，在下面过程不进行中心化处理；否则，对输入的数据进行中心化处理。（intercept 拦截）

normalize：布尔型，默认为false

说明：是否对数据进行标准化处理。（normalize 使标准化）

copy_X：布尔型，默认为true

说明：是否对X复制，为false，直接对原数据进行覆盖。即经过中心化，标准化后，是否把新数据覆盖到原数据上。

n_jobs：整型，默认为1

说明：计算时设置的任务个数（number of jobs）。为-1，代表所有的CPU。这一参数对于目标个数>1（n_targets > 1）且足够大规模的问题有加速作用。

返回值：

coef_：数组型变量，形状为（n_features,）或（n_targets, n_features）

说明：计算得到feature的系数。如果输入的是多目标问题，则返回一个二维数组（n_targets, n_features）；如果是单目标问题，返回一个一维数组（n_features）。

intercept_：数组型变量

说明：线性模型中的独立项

注意：

1. 该算法仅仅是scipy.linalg.lstsq经过封装后的估计器。

2. 返回值coef_，intercept_在fit(X, y[, n_jobs])方法学习完后值会更准确。

方法：

decision_function(X)：对训练数据X进行预测

fit(X, y[, n_jobs])：对训练集X, y进行训练。是对scipy.linalg.lstsq的封装

get_params([deep])：得到该估计器（estimator）的参数

predict(X)：使用训练得到的估计器对输入为X的集合进行预测（X可以是测试集，也可以是需要预测的数据）

score(X, y, sample_weight=None)：返回对于以X为samples，以y为target的预测效果评分。

set_params(**params)：设置估计器的参数

decision_function(X)和predict(X)都是利用预估器对训练数据X进行预测，其中decision_function(X)包含了对输入数据的类型检查，以及当前对象是否存在coef_属性的检查，是一种“安全的”方法，而predict是对decision_function的调用。

score(X, y, sample_weight=None) 定义为(1-u/v)，其中u = ((y_true – y_pred) ** 2).sum()，而v = ((y_true – y_true.mean())**2).mean()

最好的得分1.0，一般都比1.0低，得分越低代表结果越差。其中sample_weight为(samples_n,)形状的向量，可以指定对于某些sample的权值，如果觉得某些数据比较重要，可以将其的权值设置的大一些。

sklearn.linear_model.LinearRegression的更多相关文章