【转】10种机器学习算法简介

1.线性回归 线性回归通常用于根据连续变量估计实际数值(房价、呼叫次数、总销售额等)。我们通过拟合最佳直线来建立自变量和因变量的关系。这条最佳直线叫做回归线,并且用 Y= a *X + b 这条线性等式来表示。 理解线性回归的最好办法是回顾一下童年。假设在不问对方体重的情况下,让一个五年级的孩子按体重从轻到重的顺序对班上的同学排序,你觉得这个孩子会怎么做?他(她)很可能会目测人们的身高和体型,综合这些可见的参数来排列他们。这是现实生活中使用线性回归的例子。实际上,这个孩子发现了身高和体型与体重有一定的关系...

Continue Reading »
分享到:

Hadoop安装配置(伪分布式)

背景 本人这段时间一直在进行hadoop的安装配置,前前后后花费了很多时间。在这里感谢学长的帮助,才让我对安装的过程 有了更好的理解也让我更加顺利的安装成功。在这里只提供伪分布式的安装步骤,分布式的安装之后经过测试再给出。安装过程如 有错误,欢迎大家前来指正。 环境 虚拟环境:Oracle VM VirtualBox 虚拟机:ubuntu-14.04.4-server-amd64 JDK:jdk-8u131-linux-x64.tar HADOOP:hadoop-2.6.0.tar 客户端:Bitv...

Continue Reading »
分享到:

D3 (Data-Driven Documents) Examples

D3.js 可以画出非常漂亮的图。如饼状图,树状图,网络图谱结构图,甚至地图等等。主要的原理就相当于 SVG (Scalable Vector Graphics, 可缩放矢量图形)里的JQuery,支持数据与DOM元素的绑定,目前最新版本问V4,官网地址为 http://d3js.org 看一个网络示例图: 具体实现过程如下: 首先在服务器端生成Json格式的数据,示例如下: # 定义加载数据方法 def load_data(): links = [] nodes = [] friends = db_se...

Continue Reading »
分享到: