【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂

一、拟合和回归的区别

拟合并不特指某一种方法,指的是对一些数据,按其规律方程化,比如把平面(一元)上一系列的离散点,用一条直线(线性)或光滑的曲线(非线性)连接起来,而其方程化的方法有很多,回归分析(regressionanalysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,是其中一种最常见的拟合方法,还有指数平滑这样简单一些的方法,或者ARIMA,VAR,等等各种复杂一点的方法。

从离散点的角度看,它们都有靠近某条曲线的趋势,所以这些点都在朝曲线拟合,从曲线的角度看,那些离散点都在向自己靠拢,所以这些点都在回归到曲线。所以拟合表示离散点(可以拓展到高维特征)与某个曲线方程(可以拓展到模型)的偏差小(目标),回归表示如何找到这样的曲线方程或模型(方法)。

本文主要讲解拟合和回归这两个概念的区别和联系,对回归拟合的方法进行分类与总结,重点介绍了一元回归拟合的几种实现方法,关于多元回归拟合其实就是机器学习中的回归任务建模了,我后期会出案例分析!

二、回归拟合的分类

采用回归的方法,拟合出自变量x和因变量y之间存在的关系(方程或模型):

根据自变量数量,可以分为一元回归和多元回归;

按照方法可以分为统计回归模型和机器学习回归模型;

按照因变量的多少,可分为简单回归分析和多重回归分析;

按照自变量和因变量之间的关系类型,可分为线性回归和非线性回归。

对于简单回归拟合(即只有一个因变量),可以进一步做以下分类:

对于单自变量-----一元回归拟合

一元线性回归拟合:y=ax+b

一元非线性回归拟合:

特征转化:通过应用非线性变换来改变特征的表示形式,比如取X的对数X’=Ln(X),然后进行一元回归y=aX’

多项式拟合:可以看成一种多元线性拟合,将其看为有n个特征的多元线性拟合,x为一个特征,x的平方为一个特征……

其他函数拟合:指数函数、对数函数拟合等

机器学习拟合:采样神经网络(隐含层大于1)、树模型等进行拟合

对于多自变量-------多元回归拟合

多元线性回归拟合:y=a1x1+a2x2+a3x3+

多元非线性回归拟合(机器学习)

三、一元线性回归拟合准备数据
x=([1,2,3,4,5,6.5,7,8])y=([1,4,9,13,30,25,49,70])
3.1法一:

是NumPy库中的一个函数,用于多项式拟合。它可以根据给定的数据点,拟合出一个多项式函数,返回拟合的系数。

a=(x,y,1)拟合完之后用这个函数来生成多项式对象print(b)c=b(x)对原始数据画散点图(x,c,ls='--',c='red',label='fittingwithsecond-degreepolynomial')定义回归模型reg=LinearRegression()x=(x).reshape((len(x),1))(x,y)print(_)print(_)(x,y,'b.')(x,(x),'r')()

将一元视为多元回归的一种特殊情况,即只有一个特征。

系数:_:[8.83917084]

截距:_:-15.203716940671903

3.3法三:curve_fit

curve_fit是SciPy库中的一个函数,用于非线性曲线拟合。它可以根据给定的数据点和一个自定义的模型函数,拟合出最优的参数值,并返回拟合的参数以及协方差矩阵。

参数最佳值y2=func(x,popt[0],popt[1])(x,y,marker='x',lw=1,label='原始数据')(x,y2,c='r',label='拟合曲线')()用2次多项式拟合x,y数组print(a)b=(a)生成多项式对象之后,就是获取x在这个多项式处的值(x,y,marker='o',label='originaldatas')对拟合之后的数据,也就是x,c数组画图()()

系数:[1.34960956-3.365679295.01148555]

4.2法二:sklearn里面的LinearRegression()
特征处理x=(x).reshape((len(x),1))x_poly=poly__transform(x)print(x_poly)定义一个二次多项式,变量一定要放在第一个位置deffunc(x,a,b,c):returna*x**2+b*x+cpopt,pcov=curve_fit(func,x,y)print(popt)y2=func(x,popt[0],popt[1])(x,y,marker='x',lw=1,label='原始数据')(x,y2,c='r',label='拟合曲线')()自定义一个想拟合的目标函数,变量一定要放在第一个位置deffunc(x,a,b):returna*(x*b)popt,pcov=curve_fit(func,x,y)print(popt)显示()

系数:[2.477624250.41535845]

【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂它

版权声明:本站所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,不声明或保证其内容的正确性,如发现本站有涉嫌抄袭侵权/违法违规的内容。请举报,一经查实,本站将立刻删除。

相关推荐