核心奢侈品集团漫谈
原来彪马和古驰背后是同一家公司!
AdventureX杭州行记
打破局限、拉近距离、找到彼此、感受一切。
Unity测开实习面经(已过)
A bit of Madness is Key!
字节实习面经
首次技术面试体验与教训
人性的博弈
看《鱿鱼游戏》有感而发
微信读书导出pdf/epub/md/mobi
实现书籍自由!!!!!
Numpy: 对Axis的理解
本文转载自kksk知乎高赞回答,原文地址 [zhuanlan.zhihu.com](https://zhuanlan.zhihu.com/p/31275071)
GAN学习笔记
科研必备知识 -- GAN
CNN学习笔记
一文读懂卷积神经网络
机器学习之模型的评估与优化
当已经用现有机器学习算法(神经网络、决策树、逻辑回归等)构建了一个机器学习模型,但是模型的效果不是那么好,或者说我们想进一步优化这个模型时,我们可以怎么做呢?
比如我们的损失函数:
其中$\lambda$是正则化系数,我们可以尝试这些方法:
扩大训练样本
缩小特征变量维数
增加特征变量维数
增加拟合模型阶数
增大正则化系数
减小正则化系数
但是什么时候用什么方法呢?我们首先学习如何评估一个模型。
不管是回归问题还是分类问题,我们都有一个损失函数$J(\vec{w},b)$。我们要做的是最小化这个损失函数。我们通常将数据分割成 训练集和测试集两部分,通常是7:3的比例。然后分别在训练集和测试集上分别计算损失函数,如果两者最后都很小,那么可以说这个模型是有效的。(如果不是很离谱的模型,训练集上的误差大概率最后都比较小,重点看的是测试集的误差,the loss of the test data is a better indicator)
为什么需要测试集?
第一是我们需要知道模型面对未知数据的能力,不能只拿训练集的误差来衡量模型好坏,因为这些数据是用来训练的,是与调优的 ...