感知器代码实现--机器学习随笔2

这里主要是贴出我个人实现的代码
做出以下测试说明
1 分类并不能百分百正确，可能存在一些点无法正确分类的情况
2 由于没有引入代价函数，也没有使用梯度算法，这个学习率并不是非常准确，分离超平面可能不正确。同样的参数下，可以多运行几次，会出现正确的结果的。
3 希望感兴趣的朋友可以去实验以下，调整双月间距，多做几次实验。

这个算法主要验证了感知器算法是可以收敛的，并不保证能百分百分类正确！原因在前文也说明了。

希望大家能和我一起思考：如果改变数据的迭代方式（训练数据集）会对分类效果造成什么影响，为什么会有这些影响，如何消除？

#!/usr/bin/env python
# -*- coding:utf-8 -*-

import random
import matplotlib.pyplot as plt
import numpy as np
import math

# 生成上部的半月
def gernarateUp(radius,center,alf):
        xsiy = []
        ysiy= []
        for x in range(center[0]-radius,center[0]+radius,1):
            counts = random.randint(0, alf*radius)
            for y in range(counts):
                r= random.randint(center[1], center[1] + radius)
                if np.sqrt((x-center[0])**2+(r-center[1])**2)>=alf*radius and np.sqrt((x-center[0])**2+(r-center[1])**2)<=radius:
                    xsiy.append(x)
                    ysiy.append(r)
        return [xsiy,ysiy]

#生成下部的半月
def gernaratefloor(radius,center,alf):
        xsiy = []
        ysiy= []
        for x in range(center[0]-radius,center[0]+radius,1):
            counts = random.randint(0, alf*radius)
            for y in range(counts):
                r= random.randint(center[1] - radius,center[1])
                if np.sqrt((x-center[0])**2+(r-center[1])**2)>=alf*radius and np.sqrt((x-center[0])**2+(r-center[1])**2)<=radius:
                    xsiy.append(x)
                    ysiy.append(r)

        return [xsiy,ysiy]

#生成双半月
# radius -- 半径
# center -- 上月圆心位置
# akf  --  内径比例
# x -- 下月圆心与上月圆心 在x轴上的距离 大于零时 往右移动
#y --- 下月圆心与上月圆心 在y 轴上的距离  大于零时 往上移动
def gernarate(radius,center,alf,x,y):
        floorCenter=[center[0]+x,center[1]+y]
        upCenter=center
        upSet = gernarateUp(radius,upCenter,alf)
        floorSet = gernaratefloor(radius,floorCenter,alf)
        return upSet,floorSet

# 感知器模型实现
def perceptron(w,x):
    # 线性计算部分
    z = np.sum(np.dot(w,x))
    # 激活函数部分
    if z>0:
        return 1
    if z<=0:
        return -1
# 学习率计算
def learningRate(w,x):
    z = np.sum(np.dot(w, x))
    xx = np.sum(np.dot(x, x))
    r = math.ceil(abs(z) / xx) + 1
    return r
# 针对每个输入的权值更新操作
def wRefresh(w,x,d):
    a=0
    flag =True
    while flag:
        a=a+1
        y=perceptron(w,x)
        r=learningRate(w,x)
        w = w + r * (d - y) * x
        if (d - y)==0:
            flag=False
    return w




if __name__ == '__main__':
    # 初始化 上下半月
    upSet, floorSet = gernarate(100,[60,60],0.6,60,-60)

    #初始化权值向量
    # 数据点的输入是二维的，第一个参数为偏置，第二参数为点的x坐标的权值，第三个参数为点的y坐标的权值
    # 这样处理的原因是我们后续的计算中将使用 感知器的简写形式来计算
    w = np.array([0,0,0])

    # 初始化输入向量

    # 上半月的数据长度
    upx =upSet[0]
    # 初始化1list
    bx = []
    for x in upSet[0]:
        bx.append(1)

    # 整合输入，将二维输入调整为3维度输入
    # [x,y]的形式变化为[1,x,y]
    upy= upSet[1]
    upInput = []
    upInput.append(bx)
    upInput.append(upx)
    upInput.append(upy)
    # 将数据转化为numpy类
    upInput = np.array(upInput).T


    # 同上，整合输入数据，这里只不过是针对下月做处理
    ax = []
    for x in floorSet[0]:
        ax.append(1)
    floorInput = []
    floorInput.append(ax)
    floorInput.append(floorSet[0])
    floorInput.append(floorSet[1])
    floorInput = np.array(floorInput).T

    # 由于上月与下月的数据点的数量不一定一致，这里做一个边缘处理

    # 获取数据长度较小的那个 长度
    min =  min(upInput.shape[0],floorInput.shape[0])

    # 逐行迭代
    # 这里要说明一点，以下采用了上月和下月数据交替运算的方式。
    for x in range(min):
        w = wRefresh(w, upInput[x,], 1)
        w = wRefresh(w, floorInput[x,], -1)

    # 对多出来的部分做处理
    temp=None
    tempD=None
    if upInput.shape[0]>floorInput.shape[0]:
        temp=upInput
        tempD=1
    else:
        temp=floorInput
        tempD=-1
    #由于数据长度较短的 那个半月已经迭代完毕，这里对剩余的数据进行迭代
    for x in range(min,max((upInput.shape[0],floorInput.shape[0]))):
        w = wRefresh(w, temp[x,], tempD)

    # 下面是分开迭代的方法，大家可以试一试，这样可能会出现无法正确分类的情况，思考下为什么！
    # for x in upInput:
    #     w = wRefresh(w,x,1)
    # print w
    # for x in floorInput:
    #     w = wRefresh(w,x,-1)


    # 数据描点（双月数据描点）
    plt.scatter(upSet[0], upSet[1])
    plt.scatter(floorSet[0], floorSet[1])


    # 超平面绘制
    # 0 = w[1]x+w[2]y+w[1] 由此式子活得y与x的关系
    xxxi=[]
    yyyyi=[]
    for x in range(-150,280):
        xxxi.append(x)
        yyyyi.append(x*(-w[1]/w[2])+w[0]/w[2])

    # 数据描点（超平面描点）
    plt.scatter(xxxi, yyyyi)
    #数据展示
    plt.show()

本文链接：http://www.cnblogs.com/LingoXu/p/8044679.html

感知器代码实现--机器学习随笔2

感知器代码实现--机器学习随笔2的更多相关文章

随机推荐

热门专题

目录导航