免责声明:网站内容仅供个人学习记录,禁做商业用途,转载请注明出处。

版权所有 © 2017-2020 NEUSNCP个人学习笔记 辽ICP备17017855号-2

记录一次微博数据的处理

场景:现有Mysql数据库中爬取的微博数据集,如: https://www.neusncp.com/user/blog?id=91 已转存为csv格式,想存储为gml格式使用Gephi进行可视化。(受服务器资源限制,NEUSNCP的DATALAB还不足以可视化这么大的数据集 ) 话不多说,直接上代码: import networkx as nx import csv def progress(percent, width=50): '''进度打印功能''' percent = 100 if percent...

继续阅读 »
分享到:

Note of ICNC-FSKD & ICHSA 2019

首先解释一下ICNC-FSKD & ICHSA 涉及的领域:神经计算,模糊系统和知识发现,后面的ICHSA指的是和声搜索,软计算和应用。在去年的会议上,会议的名称就是ICNC-FSKD,没有涉及和声搜索的内容,而本次会议的名称中添加了ICHSA,邀请了许多South Korea 的 学者介绍和声搜索。 Topics that probably interested in: Support Vector Machines and Statistical Neural Network Models (支持向量机...

继续阅读 »
分享到:

两样本t检验

两样本 t t 检验主要用来检验两个样本是否来源于均值相等的分布。 现分别从两组抽取数据 \(x_{11},..., x_{1n_1}, x_{21},..., x_{2n_2}\) ,假设他们是从 \(N(\mu_1, \sigma^2_1)\) 与 \(N(\mu_2, \sigma^2_2)\) 两个分布抽取的样本,并希望检验零假设 ,接着计算: \[t = \frac{\bar{x_2} - \bar{x_1}}{SEDM}\] 其中,SEDM(Standard Error of Differenc...

继续阅读 »
分享到:

R语言学习笔记(5)

本篇主要介绍ARIMA模型及用法。 一、知识回顾 首先,在R语言处理中,处理时间序列常用ts, zoo, xts函数,还有很多时间格式问题。 时间序列的摘要函数 ts函数示例: ts(1:10, frequency = 7, start = c(12, 2)) 1:10是数据序列,frequency是指定这个数据序列的周期是7(每个周期里有7个值),start里接受的两个参数,第一个数12是说这个序列的初始周期序号为12,第二个数2是说这个序列的第一个值是周期中的第2个值。 > print( ts(1:1...

继续阅读 »
分享到: