(笑,你的笔记检索线索过于迂回了)

quantile

应用之中遇到的问题:我所面临的学习大数据具有很多的记录,那么请问要如何运用分位点数据去粗略进行分组然后显示这些数据的一个大致的范围和分布呢?

 百分位分组学习

【新提醒】如何按照分位数分组?不是等分 - Stata专版 - 经管之家(原人大经济论坛) (pinggu.org)

stata数据处理——分位数分组的命令 - 知乎 (zhihu.com)

原文里面的效果是按照分位点分组创造分位点分组新变量,然后recode成中低高收入标签就好了,但是我想要的效果是呈现出源数据按照分组切割的呈现,一直没办法搞出来还提示我说option行不通,可是我在只有一个变量的网络案例教学里面是跑通了的。

还有一个问题就是看不懂help文件里面的示例在讲什么,(sepby/)明明是按照它跑的。

你不知道能不能这些变量代表什么能不能不要乱试先拿简单案例尝试一下跑通了理解命令含义?中括号是可以省略

法一 -pctile- 命令

pctile 创造含有百分位点变量 Create variable containing percentiles

pctile [type] newvar = 表达式express [if] [in] [weight] [, pctile_options]

本文:pctile p_inc = fin, nq(5)

// nq(#) 命令有错, 指定4个百分位数,应当是把样本切割为4组而不是5

 三个方法达成一致,方法工具稳健性检验完毕

然后tab p_inc 或者 list p_inc in 1/3, sep(0) 两个都是显示分位点变量取值的形式

~list if命令还可以用于匹?配,与merge具有相同功效(?可是merge的话不是主要用于横向跨库合并吗?又打开了我的认知新世界。)

~题外话,line是是什么?

help line,你会知道separator(#) 意味着draw a separator line every # lines; default is
 separator(5),这个功能的意思只是显示的时候每五行画一条分隔符

破案了,只是显示方式选择

成功了,计算出分位点数量。btw 想要呈现你那样的形式也没有意义 因为取值太多了..

_pctile varname [if] [in] [weight] [, _pctile_options]

_pctile

法二 astile命令-创建百分位点

astile比 state 官方提供的xtile命令处理速度更快。 它的高效性在数据集较大或者当分组类别被多次创建时更加明显,比如说,我们可能需要根据每个年份或者月份分别创建分组。

astile inc4= finc_per, nq(4)

然后进行recode即可轻松实现原文目的

进一步list, sepby(inc4)?     这个命令是无效的,旧版的吧?

一致,后面算法性能优化,适合大数据

分位点命令复习quantile ​相关推荐

  1. XGBoost之分位点算法

    一.综述XGBoost 很多方法并非XGBoost第一次提出,当然也不是说XGBoost没改进,可以说XGBoost把算法和系统实现都做得淋漓尽致 1.系统实现 决策树的学习最耗时的一个步骤就是对特征 ...

  2. XGBoost中分位点算法快速查找分割点

    (作者:陈玓玏) 写在前面:这篇博客我自认为写得不太好,有些问题可能我自己也没有弄得多清楚,对文章有疑问的朋友可以留言讨论,不胜感激. 1.基本的查找分割点的贪婪算法 这样的算法称为精确贪婪算法,在计 ...

  3. 概率分布分位点_概率统计计量经济学_假设检验中的重要概念_分位点/p值

    在学完了几个重要分布之后,紧接着的内容就是这几个分布的使用,实际上这就是假设检验的过程 其中有一些概念: 分位点和分位数,p值,分布表,置信区间 因为是新概念, 我这种蒻蒻就是看得很不清楚,理解起来总 ...

  4. 【pytorch】时间序列预测 —— 同时预测多个分位点

    部分参考 <Multi-Horizon Time Series Forecasting with Temporal Attention Learning> <A Multi-Hori ...

  5. Python计算分位点与逆运算:根据给定的值,计算在序列中的分位水平

    计算分位数 计算一个序列的分位点,使用: import numpy as npvalue_array = np.arange(0, 10, 1) print(np.quantile(value_arr ...

  6. 标准正态分布alpha分位点

    标准正态分布alpha分位点指的是标准正态分布 X~N(0,1)中X大于z_a的概率alpha. 我们知道,标准正态分布的均值是0,方差是1,左右一个方差内的概率是68%,两个方差内是95%,三个方差 ...

  7. (极详细版)python计算分位点方法

    废话不多说,上函数的常用参数及解释: np.percentile(a, q,interpolation='linear') a:需要进行计算的列名 q:取分位点的百分比,0-100之间的数字.如当序列 ...

  8. python求上α分位点_什么是标准正态分布的上α分位点以及怎样求?

    展开全部 标准正态分布的上α分位点:设X~N(0,1),对于任给的62616964757a686964616fe4b893e5b19e31333431363638α,(0Zα)= α的点Zα为标准正态 ...

  9. 概率统计Python计算:卡方分布分位点计算

    nnn个相互独立,均服从N(0,1)N(0,1)N(0,1)的随机变量X1,X2⋯,XnX_1, X_2\cdots,X_nX1​,X2​⋯,Xn​的平方和X12+X22+⋯+Xn2X_1^2+X_2 ...

最新文章

  1. 怎样才能在一般处理文件中创建新的Session和访问已经存在的Session?
  2. OS X 要改名为 MacOS 是因为 iOS 10 要来了?
  3. progressdialog的setProgress没反应
  4. KMP算法的动态规划解说
  5. js 实时计算文本框字数限制
  6. java 队列和堆栈_Java中的堆栈和队列
  7. HarmonyOS硬件创新合作伙伴,【HarmonyOS】HarmonyOS智能硬件开发学习指南 - HDC2020
  8. python写http post请求的四种请求体
  9. 【LeetCode】4月3日打卡-Day19-字符串转整数
  10. 201912-3 化学方程式 的一种解法
  11. 学习日记day22 平面设计 构图
  12. Excel批量调整图片大小适应单元格且整齐排列
  13. 用vue简单写一个音乐播放器
  14. 养蚕日记软件测试,养蚕的过程日记300字
  15. Git笔记(6) 查看提交历史
  16. 2009年网络游戏排行榜
  17. JAVA技术及其应用实验三(抽象类和匿名类)
  18. PHP爬虫,提取网站中的关键词,用一次正则匹配,然后再PHP数组的操作
  19. 「津津乐道播客」#212. 乱炖:原地爆炸的ZOOM做错了什么?
  20. 《TextBoxes: A Fast Text Detector with a Single Deep Neural Network》论文笔记

热门文章

  1. java.io.FileNotFoundException系统找不到指定文件(已解决)
  2. 全志A40i网卡软件问题怎么办
  3. 不同发展阶段舆情如分析方法与舆情简报撰写技巧详解
  4. vue-pdf不显示盖章_如何规避OFFICE与WPS排版显示不一致
  5. HTML特殊字符对照表
  6. python,算法训练 分解质因数
  7. CoinEx Token 项目评级:BB ,展望稳定 | TokenInsight
  8. gui-gio:定时器的demo3
  9. CF--994B. Knights of a Polygonal Table
  10. 浙江七选三计算机专业分数,重磅:浙江省属43所高校2020年“三位一体”综合评价录取分数线汇总...