使用Scikit Learn对时间序列熊猫数据框进行线性回归

伊万

我正在尝试使用scikit学习线性回归器对熊猫数据框进行简单的线性回归。我的数据是一个时间序列,pandas数据框具有一个日期时间索引:

                value
2007-01-01    0.771305
2007-02-01    0.256628
2008-01-01    0.670920
2008-02-01    0.098047

做一些简单的事情

from sklearn import linear_model

lr = linear_model.LinearRegression()

lr(data.index, data['value'])

没用:

float() argument must be a string or a number

因此,我尝试用日期创建一个新列以尝试对其进行转换:

data['date'] = data.index
data['date'] = pd.to_datetime(data['date'])
lr(data['date'], data['value'])

但是现在我得到:

ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

因此,回归器无法处理日期时间。我看到了很多将整数数据转换为日期时间的方法,但是找不到例如从日期时间转换为整数的方法。

正确的方法是什么?

PS:我对使用scikit很感兴趣,因为我打算以后再做更多的事情,所以现在没有statsmodels。

汤姆·奥格斯普格

您可能希望从开始算起的天数成为此处的预测指标。假设所有内容都已排序:

In [36]: X = (df.index -  df.index[0]).days.reshape(-1, 1)

In [37]: y = df['value'].values

In [38]: linear_model.LinearRegression().fit(X, y)
Out[38]: LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)

您用于预测变量的确切单位并不重要,可能是数天或数月。系数和解释将发生变化,以便所有结果都能达到相同的结果。另外,请注意,我们需要一个,reshape(-1, 1)以便X处于预期格式。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

scikit-learn交叉验证针对时间序列数据的自定义拆分

来自分类Dev

scikit-learn交叉验证针对时间序列数据的自定义拆分

来自分类Dev

使用scikit-learn(sklearn),如何处理缺失数据(因变量y)进行线性回归?

来自分类Dev

使用Pandas数据框进行线性回归

来自分类Dev

使用重复值对时间序列重新采样

来自分类Dev

使用线性回归的时间序列

来自分类Dev

如何使用scikit-learn执行多元线性回归?

来自分类Dev

如何使用scikit-learn执行多元线性回归?

来自分类Dev

如何使用scikit线性回归模型同时求解几个独立的时间序列

来自分类Dev

使用 Scikit-Learn 使用分类数据制作回归模型

来自分类Dev

当数据不是线性时,我通过python scikit-learn使用SVR获得了线性回归

来自分类Dev

熊猫:对时间序列数据进行非季节性化

来自分类Dev

如何对时间序列熊猫数据帧重新采样?

来自分类Dev

Python / Scikit学习/回归-从熊猫数据框到Scikit预测

来自分类Dev

使用scikit-learn让熊猫玩得开心

来自分类Dev

您如何对时间序列数据进行预测?

来自分类Dev

在MATLAB中对时间序列数据进行插值

来自分类Dev

按阈值对时间序列数据进行分组

来自分类Dev

使用Scikit Learn进行Unigram分析

来自分类Dev

使用带有不同熊猫数据框的scikit-learn运行LinearRegression模型(循环问题)

来自分类Dev

使用scikit-learn训练多维数据

来自分类Dev

R如何对时间序列对象使用apply函数并将日期附加到特定列?

来自分类Dev

R如何对时间序列对象使用apply函数并将日期附加到特定列?

来自分类Dev

使用单调时钟的绝对时间

来自分类Dev

如何使用scikit-learn在Python中打印简单线性回归的截距和斜率?

来自分类Dev

线性回归的模拟scikit-learn python

来自分类Dev

pyspark 使用数据框运行线性回归

来自分类Dev

使用线性回归的年度分布时间序列数据来获得-N-年后的预测

来自分类Dev

ValueError:尝试将sklearn的线性回归器拟合到熊猫数据框实例时使用matmul

Related 相关文章

  1. 1

    scikit-learn交叉验证针对时间序列数据的自定义拆分

  2. 2

    scikit-learn交叉验证针对时间序列数据的自定义拆分

  3. 3

    使用scikit-learn(sklearn),如何处理缺失数据(因变量y)进行线性回归?

  4. 4

    使用Pandas数据框进行线性回归

  5. 5

    使用重复值对时间序列重新采样

  6. 6

    使用线性回归的时间序列

  7. 7

    如何使用scikit-learn执行多元线性回归?

  8. 8

    如何使用scikit-learn执行多元线性回归?

  9. 9

    如何使用scikit线性回归模型同时求解几个独立的时间序列

  10. 10

    使用 Scikit-Learn 使用分类数据制作回归模型

  11. 11

    当数据不是线性时,我通过python scikit-learn使用SVR获得了线性回归

  12. 12

    熊猫:对时间序列数据进行非季节性化

  13. 13

    如何对时间序列熊猫数据帧重新采样?

  14. 14

    Python / Scikit学习/回归-从熊猫数据框到Scikit预测

  15. 15

    使用scikit-learn让熊猫玩得开心

  16. 16

    您如何对时间序列数据进行预测?

  17. 17

    在MATLAB中对时间序列数据进行插值

  18. 18

    按阈值对时间序列数据进行分组

  19. 19

    使用Scikit Learn进行Unigram分析

  20. 20

    使用带有不同熊猫数据框的scikit-learn运行LinearRegression模型(循环问题)

  21. 21

    使用scikit-learn训练多维数据

  22. 22

    R如何对时间序列对象使用apply函数并将日期附加到特定列?

  23. 23

    R如何对时间序列对象使用apply函数并将日期附加到特定列?

  24. 24

    使用单调时钟的绝对时间

  25. 25

    如何使用scikit-learn在Python中打印简单线性回归的截距和斜率?

  26. 26

    线性回归的模拟scikit-learn python

  27. 27

    pyspark 使用数据框运行线性回归

  28. 28

    使用线性回归的年度分布时间序列数据来获得-N-年后的预测

  29. 29

    ValueError:尝试将sklearn的线性回归器拟合到熊猫数据框实例时使用matmul

热门标签

归档