免责声明:网站内容仅供个人学习记录,禁做商业用途,转载请注明出处。

版权所有 © 2017-2020 NEUSNCP个人学习笔记 辽ICP备17017855号-2

记录一次微博数据的处理

场景:现有Mysql数据库中爬取的微博数据集,如: https://www.neusncp.com/user/blog?id=91 已转存为csv格式,想存储为gml格式使用Gephi进行可视化。(受服务器资源限制,NEUSNCP的DATALAB还不足以可视化这么大的数据集 ) 话不多说,直接上代码: import networkx as nx import csv def progress(percent, width=50): '''进度打印功能''' percent = 100 if percent...

继续阅读 »
分享到:

Python-matplotlib.pyplot 绘图设置背景色(主题)

使用VScode+Jupyter绘图时,如果默认的主题是dark的,绘制出来的图也是深色背景的。如果想要好看一点的样式,就需要设置plt的样式了。 def draw(data): x = range(len(data)) y = [data[d] for d in data] z = zip(x, y) styles = plt.style.available print(styles) for s in styles: plt.suptitle('Style: %s'%s, fontsize=16, fo...

继续阅读 »
分享到:

Python-ARIMA

这是一个关于洗发水预测的例子。数据集下载: shampoo.csv 首先,我们将保留最后一年的数据并评估此数据的预测。 鉴于数据是每月一次,这意味着最后12个观测值将用作测试数据。 我们将使用前瞻性验证方法来评估模型性能。 这意味着将枚举测试数据集中的每个时间步,在历史数据上构建模型,并将预测与预期值进行比较。 然后将观察结果添加到训练数据集中并重复该过程。 前瞻性验证是评估时间序列预测模型的现实方法,因为人们可以期望在新观察结果可用时更新模型。 最后,将使用均方根误差或RMSE来评估预测。 RMSE的好...

继续阅读 »
分享到:

啥是佩奇

(项目代码来源于网络) 佩奇最近很火,非常火。 网上最近流传着一个直指人心的灵魂拷问啥是佩奇? 这个问题涉及到了亲情,城乡的沟通,祖孙三代人的沟通,以及一些方方面面的伦理问题。可以说,佩奇作为一个地地道道的喜剧角色,演出了直达人们内心最柔软之地的苦情效果。 那么,啥是佩奇呢? 鼓风机我们不会做,好吧,写写代码总可以吧 # coding:utf-8 import turtle as t t.pensize(4) # 设置画笔的大小 t.colormode(255) # 设置GBK颜色范围为0-255 t.c...

继续阅读 »
分享到: