免责声明:网站内容仅供个人学习记录,禁做商业用途,转载请注明出处。

版权所有 © 2017-2020 NEUSNCP个人学习笔记 辽ICP备17017855号-2

The Python Challenge爬塔记录3—4

第三关: 按照提示,也是应该要在源码里面看了吧。翻开源码,果然又是一坨乱码,这是造的什么孽。 要找出一个小写字母,两侧都被三个大写字母包围这样类型的字符串,首选果然还是正则。 开始的时候我犯了个错误,标记一下这里注意:要找的是类似aAAAaAAAa的,而非AAAaAAA,这很重要。 还是将那一长串字符串作为str1,代码如下: import re result=re.findall("[a-z]{1}[A-Z]{3}[a-z]{1}[A-Z]{3}[a-z]{1}",str1) print(res...

继续阅读 »
分享到:

The Python Challenge爬塔记录0—2

最近一直在 The Python Challenge 网站爬塔, The Python Challenge 是个很有意思的小网站,具体介绍见百度链接 https://baike.baidu.com/item/Python%20Challenge/6234024?fr=aladdin 网站或网址是 http://www.pythonchallenge.com/ , 有兴趣的同学可以一起来爬塔。 闲话少说,进入上述网址之后,就可以看到画风清奇的网站主页面,如下图。 然后点...

继续阅读 »
分享到:

新浪微博爬虫实践

最近想要获取一些真实社交网络的数据,试了试Facebook for developers, 提供了很完善的接口: https://developers.facebook.com/tools/explorer/ 但是从2018年4月4日之后,停止了friendlists的功能。 有点可惜。并且,在服务器上暂时无法访问Facebook, 在看看Google+的api: https://developers.google.com/+/web/ 测试了一下get方法,我的id是101266749844321077...

继续阅读 »
分享到:

Normalized Mutual Information 的Python 实现 (NMI.py)

NMI是Normalized Mutual Information的简称,用于比较社团划分结果与ground-truth之间的接近程度,取值范围为[0, 1],出自2006年 Danon 的论文 [1]。 有两种计算方法,为了方便大家检测结果,写了一个通用的Python版计算函数,当然也可以直接调用库函数计算。代码如下: # -*- coding: utf-8 -*- import math def NMI(c1, c2): ''' Calculate Normalized Mutual Informati...

继续阅读 »
分享到: