串联Statsmodels.OLS的DataFrame列

如果要基于Y和X2的对数构建模型,则可以执行以下操作:

import statsmodels.formula.api as smf
import numpy as np
import pandas as pd

d = {'Y': [1,2,3,4], 'X1': [5,6,7,8], 'X2': [9,10,11,12]}
df = pd.DataFrame(d)
model = smf.ols(formula='np.log(Y) ~ X1 + np.log(X2)', data=df).fit()

怎么做statsmodels.api呢?我知道我可以串联df,但是肯定有一个更简单的方法。

import statsmodels.api as sm
import numpy as np
import pandas as pd

d = {'Y': [1,2,3,4], 'X1': [5,6,7,8], 'X2': [9,10,11,12]}
df = pd.DataFrame(d)
y = np.log(df['Y'])
x = pd.DataFrame()
x['X1'] = d['X1']
x['logX2'] = np.log(d['X2'])
#x = df[['X1', np.log('X2')]] # I'd like to type sth like this
x = sm.add_constant(x)
model = sm.OLS(y, x).fit()
model.summary()

x = df...(注释行),我得到:

TypeError: Not implemented for this type
忘了它

您可以x使用pd.DataFrame以下命令进行构建

x = pd.DataFrame({'X1': df['X1'], 'log(X2)': np.log(df['X2'])})

代替

x = pd.DataFrame()
x['X1'] = d['X1']
x['logX2'] = np.log(d['X2'])

import numpy as np
import pandas as pd
import statsmodels.api as sm

d = {'Y': [1,2,3,4], 'X1': [5,6,7,8], 'X2': [9,10,11,12]}
df = pd.DataFrame(d)
y = np.log(df['Y'])
x = pd.DataFrame({'X1': df['X1'], 'log(X2)': np.log(df['X2'])})
x = sm.add_constant(x)
model = sm.OLS(y, x).fit()
print(model.summary())

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

连接Statsmodels.OLS的DataFrame列

来自分类Dev

OLS回归:Scikit与Statsmodels?

来自分类Dev

Pandas DataFrame列串联

来自分类Dev

Pandas DataFrame列串联

来自分类Dev

串联列

来自分类Dev

Statsmodels OLS function for multiple regression parameters

来自分类Dev

Python Statsmodels:OLS回归器无法预测

来自分类Dev

使用statsmodels约束OLS(或WLS)系数

来自分类Dev

Python Statsmodels:OLS回归器无法预测

来自分类Dev

Python快速DataFrame串联

来自分类Dev

串联在Python 3.6列表中的dataframe列

来自分类Dev

Statsmodels OLS函数可用于多个回归参数

来自分类Dev

如何将statsmodels中的OLS应用于groupby

来自分类Dev

使用OLS回归预测未来值(Python,StatsModels,Pandas)

来自分类Dev

Statsmodels OLS回归:对数似然,用法和解释

来自分类Dev

无法从“ statsmodels.formula.api”导入名称“ OLS”

来自分类Dev

Statsmodels OLS函数可用于多个回归参数

来自分类Dev

串联Sql列

来自分类Dev

SQL递归+列串联

来自分类Dev

水平串联列向量

来自分类Dev

DataFrame运行计数和串联

来自分类Dev

使用多列的宏串联

来自分类Dev

SQL选择与串联列不同

来自分类Dev

串联列值的Where子句

来自分类Dev

Pandas:列向量的成对串联

来自分类Dev

Pyspark Dataframe-如何基于列数组作为输入串联列

来自分类Dev

为什么我只能从statsmodels OLS fit中获取一个参数

来自分类Dev

Statsmodels-OLS群集标准错误(不接受DF的序列吗?)

来自分类Dev

从statsmodels.formula.api使用ols-如何删除常数项?