我有包含符号,出价和要价的报价数据。我能够找到每个符号的平均价差和标准差。
我想为每个符号创建一个置信区间,并在最终的DataFrame输出中包含各列
我怎样才能做到这一点?这是我所能达到的程度:
df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv',
dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice': np.float64, 'afterHours': str},
usecols=['ticker', 'bidPrice', 'askPrice', 'afterHours'],
nrows=3000000
)
df = df[df.afterHours == "False"]
df = df[df.bidPrice != 0]
df = df[df.askPrice != 0]
df['spread'] = (df.askPrice - df.bidPrice)
print(df.groupby(['ticker'])['spread'].mean())
print(df.groupby(['ticker'])['spread'].std(ddof=0) * 1.96)
只需调用pd.dataframe就可以了。
new_df = pd.dataframe(df.groupby(['ticker'])['spread'].mean())
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句