鉴于您要确定工作日和周末之间的关系,您应该将它们分成两组。这可以通过为工作日分配 0 和为周末分配 1 来实现。
为了获得更可靠的结果,您需要更大的样本量来确定周末和工作日之间是否存在显着关系。
获得更大的数据集后,您可以使用以下方法计算均值和相关性。
import pandas as pd
import numpy
d = ({
'Day' : ['Monday','Thursday','Friday','Monday','Monday','Saturday','Thursday','Friday','Friday','Wednesday'],
'Distance' : [1.498991,5.122769,1.492705,1.972825,2.517838,1.648552,2.503511,1.671742,3.974399,7.616923],
'Group' : [0,0,0,0,0,1,0,0,0,0],
})
df = pd.DataFrame(data=d)
#The average distance for Weekdays
Weekday = df.loc[df['Day'] == 0]
Weekday_mean = Weekday['Distance'].mean()
#The average distance for Weekends
Weekend = df.loc[df['Day'] == 1]
Weekend_mean = Weekend['Distance'].mean()
#Correlation between Weekends and Weekdays
corr = (numpy.corrcoef(df['Distance'],df['Day']))
print(corr)
[[ 1. -0.23640194]
[-0.23640194 1. ]]
目前这是一种负面关系,因为你只有一个周末的价值。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句