非线性回归
什么是非线性回归?
- 你们已经看到了线性回归什么时候可以用直线来拟合二元数据
- 非线性回归是什么时候可以用a曲线(而不是直线)来拟合二元数据
- 在你的考试中,回归可以是:
- 线性:
" class="Wirisformula" role="math" alt="空间y = ax + b" style="vertical-align:-6px;height:22px;width:77px">y = a x + b {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 二次:
" class="Wirisformula" role="math" alt="空间y = ax²+ bx + c" style="vertical-align:-6px;height:23px;width:119px">y = a x 2 + b x + c {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 立方:
" class="Wirisformula" role="math" alt="空间y = ax³+ bx²+ cx + d" style="vertical-align:-6px;height:23px;width:162px">y = a x 3 + b x 2 + c x + d {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 指数:
" class="Wirisformula" role="math" alt="空间y = ab ^ x" style="vertical-align:-6px;height:23px;width:58px">或y = a b x {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="Y = a e的b次方x端指数" style="vertical-align:-6px;height:23px;width:60px">y = a e b x {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 力量:
" class="Wirisformula" role="math" alt="空间y = ax ^ b" style="vertical-align:-6px;height:23px;width:58px">y = a x b {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - sin:
" class="Wirisformula" role="math" alt="空格y = asin左括号bx + c右括号+ d" style="vertical-align:-6px;height:22px;width:146px">y = a sin ( b x + c ) + d {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
如何找到非线性回归模型的方程?
- 使用你的GDC:
- 输入两套将数据整合到GDC中
- 选择相关模型
- 考试题目会告诉你使用哪种模型
- 你的GDC将计算常量
- 你可以使用对数来线性化指数和幂的关系
- 力量:
" class="Wirisformula" role="math" alt="空间y = ax ^ b" style="vertical-align:-6px;height:23px;width:58px" loading="lazy">然后y = a x b {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="Ln y = Ln a + bln x" style="vertical-align:-6px;height:22px;width:116px" loading="lazy">ln y = ln a + b ln x {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
" class="Wirisformula" role="math" alt="ln y" style="vertical-align:-6px;height:22px;width:25px" loading="lazy">而且ln y {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="ln x" style="vertical-align:-6px;height:22px;width:25px" loading="lazy">会有线性关系吗ln x {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 指数:
" class="Wirisformula" role="math" alt="空间y = ab ^ x" style="vertical-align:-6px;height:23px;width:58px" loading="lazy">然后y = a b x {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="Ln y = Ln a + xln b" style="vertical-align:-6px;height:22px;width:116px" loading="lazy">ln y = ln a + x ln b {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="ln y" style="vertical-align:-6px;height:22px;width:25px" loading="lazy">而且ln y {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="x" style="vertical-align:-6px;height:22px;width:11px" loading="lazy">会有线性关系吗x {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 力量:
考试技巧
- 您可以使用您的GDC绘制散点图,并包含回归模型的图形
- 这将使您了解模型与数据的拟合程度
工作的例子
Scarlett and Violet收集电影长度的数据(
75 |
93 |
101 |
107 |
115 |
124 |
132 |
140 |
171 |
|
83 |
75 |
51 |
38 |
47 |
56 |
76 |
91 |
70 |
最小二乘回归曲线
什么是余项?
- 给定一组n对数据和a回归模型y=f(x)
- 一个剩余是实际y价值(数据来源)-的预测y价值(使用回归模型)
" class="Wirisformula" role="math" alt="空格y下标I - f开括号x下标I闭括号" style="vertical-align:-12px;height:28px;width:73px" loading="lazy">y i - f x i {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 的残差平方和表示为
" class="Wirisformula" role="math" alt="S S下标r e S尾下标" style="vertical-align:-12px;height:28px;width:38px" loading="lazy">S S r e s {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} " class="Wirisformula" role="math" alt="S S下标re S尾下标等于从i = 1到n的开括号y下标i减去f开括号x下标i右括号的平方" style="vertical-align:-20px;height:55px;width:166px" loading="lazy">S S r e s = ∑ i = 1 n y i - f x i 2 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 如果你有两个回归模型使用相同的数据然后是那个小
" class="Wirisformula" role="math" alt="S S下标r e S尾下标" style="vertical-align:-12px;height:28px;width:38px" loading="lazy">更好地拟合数据S S r e s {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
什么是最小二乘回归曲线?
- 的最小二乘回归曲线可以被认为是"最佳拟合曲线”y=f(x)
- 对于一个给定类型的模型最小二乘回归曲线使平方残差之和最小
- 你的GDC计算最小二乘回归曲线的常数
为什么残差平方和并不总是一个很好的拟合度量?
- 方法形成两个模型相同数量的对数据的平方残差之和为a良好的匹配测量
- 如果两个模型使用不同数量的配对那么数据
" class="Wirisformula" role="math" alt="S S下标r e S尾下标" style="vertical-align:-12px;height:28px;width:38px" loading="lazy">是这并不总是适合的衡量标准S S r e s {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 和将随着数据对的增加而增加,因此不能再与具有不同数量对的数据集进行比较
- 比较这两个场景
- 10对数据,每个残差的绝对值为15
" class="Wirisformula" role="math" alt="S S下标r S末端下标等于10叉乘15平方等于2250" style="vertical-align:-12px;height:29px;width:168px" loading="lazy">S S r e s = 10 × 15 2 = 2250 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 2250对数据,每个残差的绝对值为1
" class="Wirisformula" role="math" alt="S S下标r S末端下标等于2250叉乘1的平方等于2250" style="vertical-align:-12px;height:29px;width:177px" loading="lazy">S S r e s = 2250 × 1 2 = 2250 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 10对数据,每个残差的绝对值为15
- 它们的值相同
" class="Wirisformula" role="math" alt="S S下标r e S尾下标" style="vertical-align:-12px;height:28px;width:38px" loading="lazy">但第二种情况下的残差要小得多S S r e s {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 你的GDC可能会给你均方误差
" class="Wirisformula" role="math" alt="M S e = 1 / n S S下标r S下标等于1 / n从i = 1到n对开括号y下标i减去f开括号x下标i右括号的平方求和" style="vertical-align:-20px;height:55px;width:254px" loading="lazy">M S e = 1 n S S r e s = 1 n ∑ i = 1 n y i - f x i 2 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 这是一个更好的适合度测量
- 你不需要知道这个吗这可能有助于你的理解
工作的例子
Jet是一家健身房的老板,他正在测试不同的价格选择。下表显示每月新会员的数目(
10 |
20. |
30. |
|
97 |
68 |
55 |
Jet相信他可以用其中一个模型来拟合数据
Jet希望选择残差平方和值最小的模型。
确定Jet应该选择哪个模型。
决定系数
决定系数是多少?
- 的决定系数是一个适合度测量对于一个模型
- 如果决定系数是0.57,这意味着57%的变化y变量的变化可以解释为x- variable
- 另外43%可以用其他因素来解释
- 这个比例越高,模型越符合数据
- 决定系数为用R²
- R²≤1
- R²= 1表示模型是a完美的配合对于数据
- 越接近1,拟合越好
- R²通常大于等于0
- R²可以是负的,但这超出了这门课的范围
- 如果回归模型是线性的,则决定系数为等于PMCC的平方
" class="Wirisformula" role="math" alt="R方等于R方" style="vertical-align:-6px;height:23px;width:52px" loading="lazy">对于线性模型R 2 = r 2 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 有些gdc会简单地表示R²,r²由于它与线性模型的PMCC连接
如何计算决定系数?
- 在寻找回归模型的常数时GDC可能会给你价值的
" class="Wirisformula" role="math" alt="R的平方" style="vertical-align:-6px;height:23px;width:21px" loading="lazy">R 2 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 您只会被要求计算gdc给出值的模型的决定系数R²
- 确定系数可由
" class="Wirisformula" role="math" alt="R方等于1减去分数分子S下标R S末端下标除以分母S S下标t t末端下标结束分数" style="vertical-align:-23px;height:59px;width:109px" loading="lazy">R 2 = 1 - S S r e s S S t o t {"language":"en","fontFamily":"Times New Roman","fontSize":"18"} - 在哪里
" class="Wirisformula" role="math" alt="S S下标t t尾下标等于从i = 1到n的开括号y下标i - y加上右括号的平方" style="vertical-align:-20px;height:55px;width:140px" loading="lazy">S S t o t = ∑ i = 1 n y i - y ¯ 2 {"language":"en","fontFamily":"Times New Roman","fontSize":"18"}
- 在哪里
- 你不需要知道这个吗公式,但它可能有助于你理解
决定系数是否决定模型的有效性?
- 如果R²接近于1,则模型拟合数据较好
- 然而仅仅这一点不保证这是一个很好的关系模型在两个变量之间
- 考虑数据点之间有很大差距的场景以及一个与数据吻合良好的模型
- 模型只拟合数据点上的数据
- 由于数据点之间存在差距,模型可能不适合这些领域
- 不同类型的模型都有不同数量的参数
- 因此使用不同类型的模型来拟合相同的数据会有不同程度的准确性
- 线性模型需要至少两对的数据
- 二次模型需要至少三个双的数据
- 需要立方体模型至少四个双的数据
- 使用四对数据将意味着三次模型将有R²= 1
这是因为三次图将遍历所有四段数据——当包含额外的数据对时,值可能会减小 - 然而,这并不意味着它比二次模型更适合
- 二次模型可以更准确,因为它比需要的数据多一对
工作的例子
有关猎豹长度的资料(
1.21 |
1.33 |
1.12 |
1.45 |
1.42 |
1.39 |
1.24 |
1.19 |
1.32 |
|
24.3 |
25.1 |
22.2 |
35.1 |
35.1 |
33.4 |
27.1 |
23.1 |
24.8 |