我正在使用python脚本对网站进行每小时一次的抓取,该网站发布了社交媒体平台上最受欢迎的主题标签。它们将存储在数据库(MYSQL)中,每一行是一个主题标签,然后是每小时出现在前20名中的每一列,其中列出了过去一小时内的使用次数。因此,行数和列数将不断增加,因为出现了新的主题标签,而以前出现的主题标签又重新出现在前20名中。是否有最佳方法来解决此问题?
您的设计不太适合关系数据库(例如MySQL)。最好的解决方法是将存储布局重新设计为关系数据库可以很好地使用的形式(例如,使每一行成为(标签,小时)对),或使用关系数据库以外的其他东西来存储它。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句