什么是Grid Search 网格搜索?

网格搜素是一种常用的调参手段,是一种穷举方法。给定一系列超参,然后再所有超参组合中穷举遍历,从所有组合中选出最优的一组超参数,其实就是暴力方法在全部解中找最优解。

为什么叫网格搜索,因为假设有两个超参,每个超参都有一组候选参数。这两组候选参数可以两两组合,把所有组合列出来就是一个二维的网格(多个超参两两组合可以看作是岗高维空间的网格),遍历网格中的所有节点,选出最优解。所以叫网格搜索。

存在的问题

使用网格搜索会导致,测试集上的表现效果比真实情况要好一些,因为测试集是用来对参数进行调整,参数会最终被调整为在测试集上表现效果最优的情况,而测试集样本量小,真实情况的样本量应该会远大于测试集的情况,所以测试集的样本数据分布情况与真实的样本数据分布情况有所偏差。

解决办法

对数据集多一次划分,模拟真实数据集的情况。将数据集划分为训练集、验证集、测试集。训练集是用于模型训练,验证集用于模型调参,测试集用于衡量调参后模型的好坏。这里有个疑问,如果验证集划分的太小,那么验证集对整体数据集的表现越弱,越具有偶然性,那么调参的结果可能对于整体数据集更差。这里可以引入交叉验证的方法减少偶然性。

使用场景

网格搜索可以使用在机器学习算法调参中,而很少使用在深度神经网络的调参中。因为网络搜索其实并没有什么特别的优化方法,就是简单的穷举。这种方法不使用网格搜索手动去穷举也是可以实现的,只不过网格搜索自动化一些,不需要手工的去一个一个尝试参数。本质就是把所有参数的可能都运行了一遍,对于深度神经网络来说,运行一遍需要很长时间,穷举的去调参,效率太低,更何况随着超参数数量的增加,超参组合呈几何增长。而对于机器学习的算法来说,运行时间相对较短,甚至对于朴素贝叶斯这种算法不需要去多次迭代所有样本,训练时间很快,可以使用网格搜索来调参。

Grid Search 网格搜索 介绍相关推荐

  1. 调参必备--Grid Search网格搜索

    什么是Grid Search 网格搜索? Grid Search:一种调参手段:穷举搜索:在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果.其原理就像是在数组里找最 ...

  2. 机器学习之Grid Search网格搜索(自动调参)

    什么是Grid Search 网格搜索? Grid Search:一种调参手段:穷举搜索:在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果.其原理就像是在数组里找最 ...

  3. sklearn Grid Search 网格搜索

    1. 定义 Grid Search:选取模型的最优超参数.通过优化超参数之间的最优组合来改善模型性能. (获取最优超参数的方式可以绘制验证曲线,但是验证曲线只能每次获取一个最优超参数.如果多个超参数有 ...

  4. Python机器学习笔记 Grid SearchCV(网格搜索)

    在机器学习模型中,需要人工选择的参数称为超参数.比如随机森林中决策树的个数,人工神经网络模型中隐藏层层数和每层的节点个数,正则项中常数大小等等,他们都需要事先指定.超参数选择不恰当,就会出现欠拟合或者 ...

  5. 数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}

    数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...

  6. python网格搜索核函数_(转载)Python机器学习笔记GridSearchCV(网格搜索)

    转载声明 介绍 在机器学习模型中,需要人工选择的参数称为超参数.比如随机森林中决策树的个数,人工神经网络模型中隐藏层层数和每层的节点个数,正则项中常数大小等等,他们都需要事先指定.超参数选择不恰当,就 ...

  7. 随机森林调参_机器学习-模型调参利器 gridSearchCV(网格搜索)

    在机器学习模型中,需要人工选择的参数称为超参数.比如随机森林中决策树的个数,人工神经网络模型中隐藏层层数和每层的节点个数,正则项中常数大小等等,他们都需要事先指定.超参数选择不恰当,就会出现欠拟合或者 ...

  8. 调参必备---GridSearch网格搜索

    什么是Grid Search 网格搜索? Grid Search:一种调参手段:穷举搜索:在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果.其原理就像是在数组里找最 ...

  9. 网格搜索(调参)与数据预处理

    网格搜索 Grid Search 网格搜索是一种调参手段:穷举搜索:在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果.其原理就像是在数组里找最大值.(为什么叫网格搜 ...

  10. c语言网格搜索算法例题,模型参数选择方法——GridSearch网格搜索

    在日常模型训练过程中,模型有多种选择,模型的参数同样也有多种选择,如何根据同一批数据选出最适合的模型和参数呢? 一般情况下,模型还比较好选择,是选用机器学习中分类模型例如 LR.SVM或XGBoost ...

最新文章

  1. 001_python单元测试
  2. 程序员必备的20个软件
  3. python爬虫工程师-Python-爬虫工程师-面试总结
  4. Windows Phone 7 多点触摸编程
  5. vue引入外部文件_vue文件中引入外部js
  6. 分布式高性能消息处理中心HPMessageCenter
  7. Work Queue based multi-threading
  8. 关于用css实现的文字超出部分显示省略号
  9. 【OpenCV 例程200篇】36. 直角坐标与极坐标的转换
  10. 局域网samba配置,以及在Windows环境下的访问
  11. 有没有人带?这些都是学习生信的一大助力!
  12. css-适配布局类型-流式布局-响应式布局
  13. java---键盘输入,写入到本地硬盘的数据
  14. Mac入门(四)写给Mac新人
  15. linux网桥动态ip,使用Linux主机当网桥
  16. (搬砖)Epic/Feature/Story/Task/Bug到底是什么
  17. Linux操作系统之虚拟化
  18. C++程序设计原理与实践 习题答案 第二十六章 第26章习题答案
  19. win系统C++的udp通信(接收并发送)详细教程、win下inet_pton和inet_ntop无法使用解决方法
  20. 每日文献:2018-01-29

热门文章

  1. 高通平台开发系列讲解(USB篇)MBIM QXDM 日志解析
  2. ea6500 v1 刷梅林_Linksys EA6500刷ddwrt成功记
  3. 可行性研究报告——机房收费系统
  4. vue.js 带有正则选择的车牌控件组件
  5. 使用adb命令启动模拟器
  6. Java常用软件安装包分享
  7. 不再被日报月报折磨!一键生成报表模板的神器来了
  8. 正点原子STM32f4系列其他串口通信失败问题解决
  9. 计算机技术与传感技术的关系,现代传感技术与系统课后题及答案.doc
  10. TortoiseSVN打分支、合并分支、切换分支