【大数据与机器学习】二、回归

Chapter8 回归 回归:简单说就是 由果索因 的过程,是一种归纳的思想 当看到大量的事实所呈现的样态,推断出原因是如何的;当看到大量的数字对是某种样态,推断出它们之间蕴含的关系是如何的。 线性回归是利用数理统计学中的回归分析来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。其表达形式如下: y = ax + b + e , e 为误差服从均值为 0 的正态分布 从大量的函数结果和自变量反推回函数表达式的过程就是回归 把平面上一系列的点用一条光滑的曲线连接起来的过程就叫做拟...

Continue Reading »
分享到:

【大数据与机器学习】一、基本概念

Chapter1 大数据产业 数据收集,数据存储,数据建模,数据分析,数据变现 ------------------------------------------------------------------------------ Chapter2 步入数据之门 数据:承载了信息的东西 信息很可能是因场景而定,因解读者的认知而定,所以一些符号是不是可以被当做数据,有相当的因素是取决于解读者的主观视角的。 信息:用于消除随机不定性的东西 信息就是那些把我们不清楚的事情阐明的描述。 算法...

Continue Reading »
分享到:

网上有关MNIST 数据集的详细讲解链接

MNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字,其中数字的范围从0到9。 MNIST 数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology (NIST). 训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员. 测试集(test set) ...

Continue Reading »
分享到:

Normalized Mutual Information 的Python 实现 (NMI.py)

NMI是Normalized Mutual Information的简称,用于比较社团划分结果与ground-truth之间的接近程度,取值范围为[0, 1],出自2006年 Danon 的论文 [1]。 有两种计算方法,为了方便大家检测结果,写了一个通用的Python版计算函数,当然也可以直接调用库函数计算。代码如下: # -*- coding: utf-8 -*- import math def NMI(c1, c2): ''' Calculate Normalized Mutual Informati...

Continue Reading »
分享到:

机器学习—神经网络之感知器

感知器算法基于单层神经网络的范畴,不仅是第一个以算法描述的学习算法,而且很直观,也较为容易实现。同时,它也是是最先进的机器学习算法之一人工神经元网络(也可称作深入学习)的绝好切入点。 感知器的最初概念可以追溯到Warren McCulloch和Walter Pitts在1943年的研究,他们将生物神经元类比成带有二值输出的简单逻辑门。以更直观的方式来看,神经元可被理解为生物大脑中神经网络的子节点。在这里,变量信号抵达树突。输入信号在神经细胞体内聚集,当聚集的信号强度超过一定的阈值,就会产生一个输出信...

Continue Reading »
分享到: