鉴于此,我制作了historyMatrix
如下数据框:
import pandas as pd
import numpy as np
historyMatrix = pd.DataFrame()
for ind in range(1,10):
paitent_ID = np.random.randint(100,500,1)[0]
year = np.random.randint(2002,2020,1)[0]
state = np.random.randint(1,5,1)[0]
historyMatrix.loc[paitent_ID, year] = state
historyMatrix.to_csv("./historyMatrix.csv", sep=',', encoding='utf-8', index=False)
当我打印时,historyMatrix
我得到以下结果:
2019 2016 2017 2006 2003 2007 2010
371 4.0 NaN NaN NaN NaN NaN NaN
122 NaN 1.0 NaN NaN NaN NaN NaN
106 NaN NaN 4.0 NaN NaN NaN NaN
298 NaN NaN NaN 2.0 NaN NaN NaN
466 NaN NaN NaN NaN 1.0 NaN NaN
435 NaN NaN NaN NaN 3.0 NaN NaN
497 NaN NaN NaN NaN NaN 2.0 NaN
471 NaN NaN NaN NaN 1.0 NaN NaN
410 NaN NaN NaN NaN NaN NaN 1.0
我尝试使用以下代码构建the paitent_ID列:
paitent_ID = np.random.randint(100,500,1)[0]
但是当我保存数据框时,paitent_ID colume(以开头371
)不存在。
如何解决?
您正在使用patient_ID
as索引,index=False
将其保存到csv时将其从代码中删除,它应如下所示:
historyMatrix.to_csv("./historyMatrix.csv", sep=',', encoding='utf-8')
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句