摘要: 研究目标只需要说清楚完成的项目长什么样子, 但并没有那么容易写.

1. 日常生活所讨论的目标

  • 例 1. 我要去北京天安门.
    这里的目标很容易描述, 就是 “北京天安门”.
    如何证明你达成目标? 以下二选一: a) 你用肉眼看到它; b) 你站在门的下方.

  • 例 2. 一个小目标: 先赚它一个亿.
    这里的目标描述没有歧义: 一亿人民币.
    如何证明你达成目标? 银行帐户显示: 资产 − - − 负债 ≥ \ge ≥ 1 亿元人民币.

2. 软硬件项目所讨论的目标

  • 例 3. 交换机带宽达到 1000 MB/s.
    明确的目标: 带宽达到 (不小于) 1000 MB/s.
    要证明目标的达成, 只需要用数据测试 10 小时.

  • 例 4. Web 办公系统满足 3000 教职工的并发使用, 延迟时间不超过 0.5 秒.
    明确的目标: 3000 教职工并发使用的时候延迟时间不超过 0.5 秒.
    指标很清楚, 通过压力测试也易于验证目标的达成.

3. 机器学习科研项目所讨论的目标

科研项目讨论的目标至少有三种: 算法、模型、系统. 我们倒过来说.

3.1 机器学习系统

作为系统, 应与具体应用强相关, 甚至可以是商用系统. 与之相匹配的是, 通用性不强.

  • 例 5. 人脸识别系统, 识别率 99%.
    这是成熟的软硬件系统. 我们将它安装到小区, 然后再把小区人员的照片放进去, 下次我们通过门闸时, 它就会放行.
    指标很清楚: 100 个小区的人员, 它至少放 99 个过去; 100 个外来人员, 它最多放一个过去.

3.2 机器学习模型

作为模型, 应针对一大类的实际应用, 同时具有较好的通用性.

  • 例 5. 基于图片的的物品识别模型, 识别率 99%.
    需要先给这个模型一定数量的图片, 如 1000 个手机, 2000 个包包, 1200 只鞋子. 同时给定这些图片的标签 (手机/包包/鞋子). 经过模型训练 (获得参数) 后, 它对这些物品的识别率达到 99% 以上. 即错误率小于 1%.
    如果是用深度学习来做这个项目, 模型的结构应该 (包括层数、卷积核大小、drop-out 比例、激活函数等) 是确定的. 训练的目的是获得针对该数据集的参数.
    为了评价这个学习模型的目标是否达成, 我们需要用多个数据集进行训练与测试. 这里的评价比上一节其实更难, 因为不同数据集中, 图片的分辨率不同, 噪声不同, 所以比较难于作出 99% 的承诺.
  • 例 6. 骨干神经网络 backbone neural network.
    What Does Backbone Mean in Neural Networks?
    根据这里的解释, 神经网络中, 骨干网络是一种预训练网络, 可为不同的任务提供属性提取服务.

3.3 机器学习算法

作为比较底层的算法, 针对性弱, 但通用性强.

  • 例 7. 图片分类算法.
    主要讨论算法的机制, 基础的技术. 它的针对性可能并没那么强, 甚至可能支持不同的分类任务, 如 kNN, decision tree.
    它本身并不告诉你如何设置超参数,如: k k kNN 的 k k k 值及采用的距离函数; 深度学习的网络层数、卷积核大小等.

4. 机器学习项目的研究目标范例

有了以上的基础, 这里来讨论如何写具体的目标.

4.1 应用驱动的项目

  • 例 8 (硬杠系统指标). 本项目拟基于多时序、多模态的游客数据、旅游景点数据、餐饮数据、住宿数据, 开发针对都江堰市及其周边的一套智慧旅游系统, 具有如下功能: 对用户偏好的预测, 准确率不低于 85%; 以家庭或个人为单位的个性化旅游线路推荐, 满意度不低于 90%, 综合考虑游客满意度与负载均衡的团体旅游线路推荐, 满意度不低于 90%; 支持 100,000 个用户的并发访问, 服务器延迟不超过 0.5s.
    分析:
    a) 描述了系统的一些具体功能, 以及相应的指标;
    b) 这是最“正宗”的研究目标, 与研究内容的味道严格区分;
    c) 与例 4 相比, 系统更大, 功能更加细化;
    d) 作为“研究目标”, 并没有“研究”的味道, 感觉是为了某公司而开发的一个实际系统, 充满了金钱的味道.

  • 例 9 (兼顾不同层面). 本项目拟针对智慧旅游所涉及的多时序、多模态数据, 提出实时准确的时序预测算法、交互式的推荐算法, 构建智慧旅游的通用框架, 并开发一套具有川西特色的智慧旅游系统.
    分析:
    a) 把算法 (小)、模型 (中)、系统 (大) 三个层面的目标都写上了;
    b) 每个目标都具有相应的考评指标 (实时准确、通用、具有特色);
    c) 希望这种模式能与研究内容 (也讨论 what)、技术路线 (讨论 how) 的味道区别开来;
    d) 张老板觉得这个味道和摘要的差不多.

  • 例 10 (描述系统特点). 本项目拟针对游客、旅游景点、餐饮、住宿等多时序、多模态数据, 构建一套智慧旅游系统, 预期特点包括: 具有良好的预测能力, 对常游客的偏好提供准确预测; 具有良好的个性化旅游线路推荐能力, 满足家庭或个人的需求; 具有良好的多元化团体旅游线路推荐能力, 拉动旅游点均衡发展.
    分析:
    a) 与例 8 相比, 不写太具体的区域, 避免搞成一个商业项目, 失去“研究”的味道;
    b) 不写可量化的指标, 因为研究之前无法保证它们能达到.

  • 例 11 (高屋建瓴). 以xxx的需求为牵引,突破xxx理论与方法的瓶颈;解决xxx等导致的xxx等核心科学问题,促进xxx融合;促使xxx的应用,以获得xxx的结果。
    分析: 这个版本就不透露细节了, 至少要用红包来换.

4.2 模型开发的项目

  • 例 12 (只谈模型). 本项目为推进旅游业的发展, 开发具有可扩展性的智慧旅游框架, 一方面提供助游客数据、景点数据、餐饮数据等的接口; 另一方面能将这些数据有机融合提供统一的数据挖掘平台, 以支持区域智慧旅游项目的快速搭建.

4.3 算法研究的项目

从实际应用的角度, 研究的目标是获得一个可用的系统 (产品、蛋), 其评价指标包括: 完整性 (不依赖其它系统), 精度 (仅考虑某一种数据).
从计算机专业的角度, 研究的目标是获得算法 (母鸡), 其评价指标包括: 通用性 (是否适应于各类数据), 效率 (时间、空间复杂度), 精度 (或泛化能力,需要在尽可能多类别上的数据进行测试).
因此, 这种研究目标更难写.

  • 例 13 (只谈算法). 本项目拟针对多时序分析问题, 开发一套适用于结构化数据、图片数据、视频数据、时序数据的在线主动学习算法, 时间复杂度不超过 O ( n 2 m ) O(n^2m) O(n2m), 空间复杂度不超过 O ( m n ) O(mn) O(mn), 其中 n n n 为样本数, m m m 为特征数; 在相同查询的比例下, 预测准确率不低于流行的算法.

5. 小结

总觉得还没写到位. 什么套路才是最简洁、最清晰的呢?
继续努力!

NSFC: 研究目标看似简单相关推荐

  1. 无监督学习最新研究:通过简单的「图像旋转」预测便可为图像特征学习提供强大监督信号

    作者:Spyros Gidaris.Praveer Singh.Nikos Komodakis 「雷克世界」编译:嗯~是阿童木呀.KABUDA.EVA 在过去的几年中,深度卷积神经网络(ConvNet ...

  2. 看似简单的hashCode和equals面试题,竟然有这么多坑!

    作者:徐刘根,大家都喊我根哥! hashCode()方法和equals()区别与联系这到面试题,看似简单,根据以往面试星友的情况来说,绝大部分人都不能很好的回答出来,要么没有逻辑,想到一句就说一句,要 ...

  3. equals的效率_看似简单的hashCode和equals面试题,竟然有这么多坑!

    点击上方"Java后端技术",选择"置顶或者星标" 你关注的就是我关心的! hashCode()方法和equals()区别与联系这到面试题,看似简单,根据以往面 ...

  4. 【论文写作】论文中研究背景、国内外现状、研究目标、拟解决的关键问题、创新性、研究意义要怎么写

    文章目录 1.各部分概要 2.研究背景 3.国内外现状 4.研究目标 5.拟解决的关键问题 6.创新性 7.研究意义 1.各部分概要 论文的研究背景: 研究背景是论文的开篇之一,是介绍论文研究背景及现 ...

  5. 【转】【荐】看似简单的问题 静态方法和实例化方法的区别

    [转自]看似简单的问题 静态方法和实例化方法的区别 这是一个经常被时时提出来的问题,很多时候我们以为理解了.懂了,但深究一下,我们却发现并不懂. 方法是我们每天都在写得,很多程序员大多都使用实例化方法 ...

  6. 可突破任意ARP防火墙,以限制流量为目标的简单网络管理软件

    以下消息来自幻影论坛[Ph4nt0m]邮件组 软件说明: 可突破任意ARP防火墙,以限制流量为目标的简单网络管理软件. 使用方法: 1.在参数设置中选择好工作网卡: 2.检查网关信息和本机信息是否正确 ...

  7. hashcode的作用_看似简单的hashCode和equals面试题,竟然有这么多坑!

    hashCode()方法和equals()区别与联系这到面试题,看似简单,根据以往面试星友的情况来说,绝大部分人都不能很好的回答出来,要么没有逻辑,想到一句就说一句,要么抓不住重点,答非所问.从这个很 ...

  8. 绘图的尺寸_AutoCAD新功能:参数化绘图,绘制看似简单,实际复杂,案例详解...

    虽然很熟悉 CAD 软件的使用,但是对于CAD参数化绘图功能并不了解,甚至不知道.随着 CAD 版本的不断更新,功能越来越完善和强大,从AutoCAD2010 版本开始,增加了一个支持利用约束条件绘制 ...

  9. 看似简单的搜索引擎,原来背后的数据结构和算法这么复杂?

    来源 | 码海 封图 | CSDN 付费下载于视觉中国 前言 我们每天都在用 Google, 百度这些搜索引擎,那大家有没想过搜索引擎是如何实现的呢,看似简单的搜索其实技术细节非常复杂,说搜索引擎是 ...

最新文章

  1. Linux下Shell日期的格式
  2. Linux常用监控命令简介 – vmstat,ps,free,uptime 等
  3. springmvc+log4j操作日志记录,详细配置
  4. Spring Cloud【Finchley】-15 查看Zuul的路由端点和过滤器
  5. opencv学习笔记4:获取图像属性
  6. 哈希表处理冲突的方法?
  7. android之Activity的生命周期
  8. .NET6 如期⽽⾄
  9. 从事件和DDD入手来构建微服务
  10. 做游戏,学编程(C语言) 21 台球
  11. 杭电 2838 牛叉的树状数组
  12. jqueryUI日期控件和时间控件
  13. Linux 挂载 IP SAN
  14. 我们雇佣了一只大猴子...
  15. java take,Java DelayQueue take()用法及代码示例
  16. 假如生产环境出现CPU占用过高,如何分析思路和定位?
  17. 华为在高端手机市场首尝被小米击败的滋味,这是一个信号
  18. 用python怎么读文件_python怎么读文件
  19. photon 服务器操作系统,PhotonServer游戏服务器端教程
  20. 主板常见故障维修24例

热门文章

  1. Android面试必问的Activity,初阶,中高阶问法,你都掌握了吗?(要求熟读并背诵全文)
  2. Excel可视化图表高级操作,使用滚动条控制图表展示范围
  3. 决胜移动互联网 网址导航迎来新曙光
  4. 买的起苹果XS依然是隐形贫困人口 国产手机崛起对苹果有多大威胁
  5. Pycharm远程使用Linux环境配置步骤
  6. SOLIDWORKS钣金转换工具的使用
  7. 商品sku算法php,笛卡尔乘积-电商网站商品sku组合算法应用
  8. python蟒蛇绘制----计算机绘图
  9. 下列不属于计算机软件含义的是,统考计算机应用基础考试大纲及答案
  10. CDOJ:1636-梦后楼台高锁,酒醒帘幕低垂(Kruskal+暴力)