我尝试了几种不同的方法,在其中找到了一些方法,其中包括制作Node类和嵌套字典,但是我似乎无法使它们正常工作。
目前,我的代码吸收了几行DNA(a,t,g,c),然后将其存储为numpy数组。然后,它找到增益最大的属性,并将数据分成4个新的numpy数组(取决于该属性处出现的a,t,g或c)。
我无法创建可以构建树的递归函数。我对python和编程本身还是很陌生,所以请详细描述我应该做什么。
谢谢你的帮助
如果您希望将决策树与python结合使用,则可以使用Sci-kit学习中的决策树模块,而不用编写自己的决策树类和逻辑:http : //scikit-learn.org/stable/modules/tree。 html。使用Scikit Learn决策树模块,您可以将决策树对象保存到内存中,或者可以将决策树的某些属性写入文件或数据库。
Sci-kit学习以及Anacondas软件包中包含的其他python库几乎都是python数据探索和分析的标准。您可以从Continuum获取Anaconda软件包:http : //continuum.io/downloads
编辑1
我在《黑客新闻》上遇到了这个问题。这是关于使用PostgreSQL作为从中提取值的数据库在Python中构建决策树。结帐可能会很有趣:http://www.garysieling.com/blog/building-decision-tree-python-postgres-data
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句