这道题应该算是我原创的的一道题,来源于我遇到的一个具体需求。大致需求是已知一批数和每个数出现的次数,然后写个接口,每次调用都能返回已知数据中的某个数,且返回的概率和原始数据中每个数出现的概率一致,题目描述起来有些绕口,我们来举个实际的例子。

以上面的输入为例,要求实现的接口必须以11.96%的概率返回5、18.10%的概率返回91……16.55%的概率返回98,当然我的要求不仅仅是这几个数,而是可能有10^5个数。 先别急着往下看,给你几分钟先思考下。

各种语言其实都内置了random函数,可以随机返回int或者long型的随机数,这里我们先不考虑溢出的问题。为了方便讲解,假设我们已有n个数存在在num[n]中,其出现的频次存放在fre[n]中。 借助已有的random(),我们很简单就可以生成0-n之间的一个随机数i,但是如果直接返回num[i]的话,每个数返回的概率是一致的,明显不满足我们的需求。

其实解决方案也很简单,我们按照每个数出现的频次大小,将其映射成不同的区间大小,出现的概率越大,区间越大。想象下,这些数据按不同的区间大小把一个飞镖盘分成不同的部分,我们生成数的时候就是拿个飞镖随机扎,扎到哪个算哪个。
当然我们可以直接用一位直线区间描述上面的二维飞镖盘模型。只需要随机生成0-100%之间的数即可,假设某次随机生成的数是0.65(65%),我们算一下 正好对应在数字58对应的区间上,所以这次直接返回58就是了,我们可以开始写代码了。

    int[] num; // 数字int[] fre; // 出现的频次double[] pro;  // 出现的概率int n;  // 数据量void init() {int sum = 0;for (int i = 0; i < n; i++) {sum += fre[i];}for (int i = 0; i < n; i++) {pro[i] = fre[i]/sum; // 计算出每个数出现的概率 }}int getRandom() {double rp = random.getNextDouble();double sum = 0;for (int i = 0; i < n; i++) {if (sum >= r && sum + pro[i] > rp) {  //找到命中的区间return num[i]; }sum += pro[i];}return num[n-1];}

似乎一切都很完美,但每次getRandom()的时间复杂度是O(n),大量的使用性能也抗不太住。有没有更好的实现方式?既然写到这里了,必然是有的。

上面代码循环中有个sum += pro[i]; 每次计算都要累加,我们是不是可以提前在init()中累加好?然后你会发现因为每次累加的数都只正数,所以pro是个递增序列,对于有序序列的查找 二分必然是首选。这时候我们可以用二分重写上面代码。

    int[] num; // 数字int[] fre; // 出现的频次double[] pro;  // 出现的概率int n;  // 数据量void init() {int sum = 0;for (int i = 0; i < n; i++) {sum += fre[i];}for (int i = 0; i < n; i++) {pro[i] = fre[i]/sum; // 计算出每个数出现的概率if (i != 0) {pro[i] += pro[i-1];}}}int getRandom() {double rp = random.getNextDouble();int l = 0;int r = n-1;while (l != r) {   // 二分查找确定区间位置  int mid = (l + r) >> 1;if (pro[mid] < rp) {l = mid + 1;} else {r = mid;}}return num[n-1];}

到这里问题就彻底解决了,但是最后给大家留下一个思考题。

上述代码中pro[]的计算有必要吗? 能否直接用fre[]替代其功能?

面试题精选:数据伪造相关推荐

  1. 金三银四,磨砺锋芒;剑指大厂,扬帆起航(2020年最全大厂WEB前端面试题精选)下

    引言 元旦匆匆而过,2020年的春节又接踵而来,大家除了忙的提着裤子加班.年底冲冲冲外,还有着对于明年的迷茫和期待!2019年有多少苦涩心酸,2020年就有更多幸福美好,加油,奥利给!怀着一颗积极向上 ...

  2. Top 10国际大厂人工智能岗位经典面试题精选

    Top 10国际大厂人工智能岗位经典面试题精选 https://www.toutiao.com/a6635196559355019780/ 2018-12-15 20:31:25 AI专业应届毕业生年 ...

  3. 机器学习笔试题精选(二)

    https://blog.csdn.net/red_stone1/article/details/81023976 上次 机器学习笔试题精选(一)中,我们详细解析了机器学习笔试 15 道题.今天,红色 ...

  4. 机器学习笔试题精选(七)

    红色石头的个人网站:redstonewill.com 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常常会遇到各种各样的机器学习问题和知识点.为了帮助大家对这些知识 ...

  5. 终章 | 机器学习笔试题精选

    点击上方"AI有道",选择"置顶公众号" 关键时刻,第一时间送达! 读本文大约需要 9 分钟 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关 ...

  6. Unity面试题精选(6)

    洪流学堂,让你快人几步. 本篇文章首发于我的公众号:洪流学堂 整理了一些Unity面试题目,希望可以帮助到你. 面试官:在C#中using和new这两个关键字有什么意义? 答: using 关键字有两 ...

  7. Unity面试题精选(5)

    洪流学堂,让你快人几步. 整理了一些Unity面试题目,希望可以帮助到你. 面试官:数组和List两者效率之间哪个好? 答: 数组: 数组在C#中是最早出现的.它在内存中是连续的存储的,所以索引速度很 ...

  8. 网络工程师面试题精选

    网络工程师面试题精选 1.请你修改一下LINUX的视频驱动和声音驱动? 答:redhatlinux中用sndconfig来设置声卡,如果没有某个模块,就需要重新编译内核(编译最新发布的linux 内核 ...

  9. python自动化面试提问_Python自动化测试笔试面试题精选

    前言 随着行业的发展,编程能力逐渐成为软件测试从业人员的一项基本能力.因此在笔试和面试中常常会有一定量的编码题,主要考察以下几点. 基本编码能力及思维逻辑 基本数据结构(顺序表.链表.队列.栈.二叉树 ...

最新文章

  1. NLP突破性成果 BERT 模型详细解读 bert参数微调
  2. python 3 5的值_python3 语言特性5
  3. 19道小米网运维工程师笔试真题
  4. 无锁数据结构二-乱序控制(栅栏)
  5. 如何在labview中用c语言编程,编程语言之争:LabVIEW还是C语言?-测试测量-与非网...
  6. 只保留日期_全历手表与年历腕表都能看日期,为何唯独万年历腕表价格不菲?...
  7. 人民币发行量比美元还大吗?
  8. std在汇编语言是什么指令_汇编语言程序指令整理
  9. ASP.NET MVC中的控制器激活与反射之间的联系(帮助理解)
  10. 智慧解析第20集:破解迷魂术
  11. [高频电子线路]-避免从第一章开始懵逼
  12. 支持扫描的单usb口打印服务器,TL-PS110U 单USB口打印服务器
  13. 使用github免费搭建个人网站详细教程
  14. 为什么在POS非常火爆的时候代还系统还能抢下市场呢?
  15. 单元测试|Unittest setup前置初始化和teardown后置操作
  16. 智安网络丨DDoS攻击:无限战争
  17. 香港城市大学赵翔宇招收AI机器学习数据挖掘 全奖PhD/博后/RA
  18. 湖北理工学院c语言作业实验六,湖北理工学院c语言实验报告实验六
  19. 个人简历模板html5
  20. 三、Amlogic A311D 音频驱动指南

热门文章

  1. 谷歌砸重金求挑错,360发现安卓重大安全漏洞
  2. NOIP2010提高组 关押罪犯
  3. 误删除oracle目录,LINUX下误删除Oracle数据库恢复方法
  4. 前端本地模糊搜索并高亮
  5. error: 路径规格 ‘xxxxxxxxx‘ 未匹配任何git已知文件
  6. js清空数组的三种方法
  7. 轮式里程计+视觉紧耦合方案
  8. Java网络聊天室---个人博客
  9. chocolatey使用
  10. Android Studio——简易音频播放器