选择题10道,问答题三道,分析题2道

  一、选择题

  1、 一下哪个属于离散变量(汽车变量)

  水稻亩产量 家庭收入 商品价格 汽车产量

  2、 卡方分布的样本方差分别是(2n)

      n 1 2n 4n

  3、 有个人买彩票,中奖概率为1/10,每次花200元,连续买5次,如果中奖则奖金为1000元,问不赔钱的概率是多少

1-(9/10)^5

  4、 世界男女比例相当,黄种人比其他人种多的多,其他人种男的比女的多,以下那句是正确的 (B)

   A、黄种人男人比黑种人女人多       B、黄种人女人比黑种人男人多

  5、 关于聚类分析的题目,判断哪句不正确

  6、 均值>中位数>众数,问这个分布偏左还是偏右

右偏

  7、 随机无放回抽样跟随机有放回抽样比较,哪个方差大,还是相等

有放回的方差更大,它的概率范围更广,偏离程度更大

  8、 回归分析y=a+bx,如果存在自相关,问b的值如何,是正负还是0,还有显著性如何?

b值是正负,显著性水平高

  

二、问答题

  1、SQL语句,表A有member_id, city,表B 有 member_id, price几项,将A和B链接,且指定城市和price>10. Member_id为主键.如果不会写就给出数据分析的思想。

select * from A join B on A.member_id=B.member_id where city='北京' and price>10.

  2、数据清理中,处理缺失值的方法

对于缺失值的处理,从总体上来说分为删除存在缺失值的个案和缺失值插补。

选分为三个步骤:

①为每个空值产生一套可能的插补值,这些值反映了无响应模型的不确定性;每个值都可以被用来插补数据集中的缺失值,产生若干个完整数据集合。

②每个插补数据集合都用针对完整数据集的统计方法进行统计分析。

③对来自各个插补数据集的结果,根据评分函数进行选择,产生最终的插补值。

  3、回归分析中出现的多重共线性问题是什么,如何处理?

所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。

消除多重共线性的方法:
1.增加样本容量
2.利用先验信息改变
3.删除不必要的解释变量:参数的约束形式
4.其它方法:逐步回归法,岭回归(ridge regression),主成分分析(principal  components ).
这些方法spss都可以做的,你在数据分析的子菜单下可以找到相应的做法。
删除不必要的方法的时候,最好使用一下逐步回归法,这样比较科学一点。
主成分分析的方法使用比较简单科学,本人建议用该方法。

  三、分析题

  1、对不同价位区间的商品做活动,表A给活动出流连次数与总体浏览次数,表B给出活动商品转换率和总体商品转换率,分析现象

  2、某电商推出一款新的产品,希望这个产品能大卖,让你给这个主题取个名字,如果你是数据分析师,设定哪些指标来判断,给出指标的定义和意义,至少三个。

2014阿里巴巴校园招聘数据分析师职位笔试题目(答案版)相关推荐

  1. 2014阿里巴巴校园招聘的一些感悟

    2014阿里巴巴校园招聘 本来只是抱着试一试的心态去参加2014年阿里巴巴校园招聘(本人大三,2015年毕业),所报岗位:前端工程师. 首先阿里2014校园招聘前端是在线笔试的,前5道题目谈各种人生理 ...

  2. 优酷土豆java面试_优酷土豆校园招聘Java开发类笔试题目

    先总体说下题型,共有20道选择题,4道简答题,3道编程题和1道扩展题,题目都比较简单,限时一小时完成, 一.选择题 选择题非常简单,都是基础题,什么死锁发生的条件.HashMap和HashSet查找插 ...

  3. 数据分析师 2020-8-09笔试题目 有感

    作为应届毕业生,找工作ing~~~~8月9号做了某公司数据分析师笔试题目,SQL太久没写了,有点沦陷,还有两道大题,题目挺有意思的,和身边的朋友还有工作的姐姐讨论了一下,觉得有必要进行一些总结,也期待 ...

  4. 【笔试题目整理】 网易2018校园招聘数据分析师笔试卷

    最近在准备数据分析岗位的笔试,整理了牛客网上的一些试题与答案方便查看. 试卷信息: 客观题:单选20道 主观题:问答1道,编程2道 完成时间: 120分钟 难度系数: 三颗星 总分: 100分 注:省 ...

  5. 2014阿里巴巴校园招聘笔试

    阿里的笔试总共三套题,这里给出的是A卷. 欢迎加入IT面试4群143014133( 高级群 (一群二群已满 ,已经加1.2.3群的同学不要在加4群了).

  6. 2014阿里巴巴校园招聘笔试题-----研发工程师

    1.一次内存访问.SSD硬盘访问和SATA硬盘随机访问的时间分别约是() A.几微秒,几毫秒.几十毫秒 B.几十纳秒,几十毫秒,几十毫秒 C.几十纳秒.几十微秒.几十毫秒 D.几微秒.几十微秒.几十毫 ...

  7. 2014阿里巴巴校园招聘笔试题 - 中南站

    转载于:https://www.cnblogs.com/gotodsp/articles/3530329.html

  8. [历年IT笔试题]2014京东校园招聘软件开发类笔试试题

    来源:点击打开链接

  9. 2014阿里巴巴校园招聘研发工程师笔试题(北邮站)

    选择1,C 内存读写速度的单位是ns(纳秒).2,B. 3,C,因为是定长子网,子网掩码为255.255.255.248. 那么,最大子网个数应该是二的五次方等于三十二个.每个子网内除去一个广播地址和 ...

最新文章

  1. java 远程共享_【原创】(扫盲)远程共享对象SharedObject的用法
  2. ios游戏开发 Sprite Kit教程:初学者 2
  3. 西安电子科技大学泄漏信息
  4. centos 6.5配置samba
  5. Android 编程下 java.lang.NoClassDefFoundError: cn.jpush.android.api.JPushInterface 报错
  6. Vue学习笔记进阶篇——Render函数
  7. linux里工作目录的字体变蓝,netterm访问Linux时字体和背景颜色随目录发生改变的问题解决...
  8. x86汇编代码转x64平台使用(VS2010测试通过)最简单的方法
  9. Unity面试题精选(6)
  10. 使用DataX从ORACLE同步数据到MYSQL
  11. 《Docker技术从入门到实践》第3,4,5章(三大概念)
  12. 关于Decision in process状态时间变化的解释
  13. sublime3环境
  14. Linux中fork函数作用,深入解析Linux中的fork函数
  15. linux文件系统基础知识--目录项 dirent、inode 和数据块
  16. JavaScript获取CSS内联样式和外联样式
  17. jQuery ajax教程
  18. 无人机项目跟踪记录五十八--原理图控制部分分析
  19. 如何跳过计算机配置直接开机,WIN7开机怎么跳过欢迎界面_win7怎样跳过电脑开机欢迎界面-win7之家...
  20. 科学家研发真实版的《星际迷航》牵引光束

热门文章

  1. Zernike条纹多项式系数(Zernike Fringe Coeffecients)
  2. BEGAN实现不同人脸的生成(tensorflow实现)
  3. 锂电池BMS软硬件习资料
  4. Flutter从入门到精通之Dart基础篇(一)
  5. 如何查看进程工作路径
  6. 动态设置css样式,背景图,class
  7. 计算机进入vga模式,VGA模式
  8. PIC单片机应用开发实践教程(七):PIC16F153xx——时钟使用
  9. Vite使用vw适配方案
  10. grunt-contrib-compass 编译sass