以前在学校接触过SAS,跟着课程学习并将SAS用于统计理论的实现,学习期间断断续续,不成系统。2013年有幸参与SAS在高校举办的首次数据分析大赛,并获得“团体十强”的荣誉,之后很长一段时间都没有投入到SAS的学习和应用,有愧于这样的荣誉。经过一段时间的思考,决定来一次疯狂的系统性学习,主要参考夏坤庄的《深入解析SAS—数据处理、分析优化与商业应用》和高惠璇老师的SAS系列手册。

数据分析与挖掘过程:

1)数据源的问题,即根据某些分析对象或业务逻辑,如何将所需的数据进行收集、整合

2)数据探索,当数据准备妥帖后需要进一步探索数据的完整性和准确性,即数据的缺失情况、异常情况、分布情况等需要进行探索

3)数据建模,只有在数据得到“干净”的保证下,才可以对其进行建模,而建模又是一个学问很深的水,需要理论知识与数据业务的搭配

4)模型验证,模型验证是至关重要的,训练集良好不代表测试集也好,所以需要综合考虑多种方案,选择最佳的方案和组合

5)模型部署,当模型成熟,并得到验证后,就可以将其部署到真实的生产环境中,用于解决分类、预测等问题

而以上正是SAS数据分析与挖掘的应用流程。

SAS中常用的模块

SAS/BASE:核心模块。数据管理、交互环境管理、语言处理、调用其他模块

SAS/STAT:覆盖几乎所有实用数理统计分析方法

SAS/EM:数据挖掘

SAS/ETS:时间序列分析

SAS/GRAPH:图形软件包,产生各种图表

SAS/IML:功能强大面向矩阵运算的编程语言

建立SAS的逻辑库

在数据准备之前,需要为其布置一块物理地址存放数据,即需要建立一个逻辑库用于存放外部数据。具体步骤如下:

1)先在硬盘上建立需要存放SAS数据集的目录

2)在编辑窗输入Libname命令(Libname  SASLabname 'Path'),并提交命令

LIBNAME MyData 'G:\学习\每天坚持写一点点代码\SAS\SAS系统学习\SAS Data';


这样,一个自定义的逻辑库就建立完毕,如果SAS Data文件夹中有SAS数据集的话,逻辑库MyData中就会显示出响应的数据集;如果将外部数据转换为SAS数据集,并存放到MyData逻辑库中,对应的物理路径下的SAS Data文件夹也会存在该数据集。

创建一个简单的SAS数据集

DATA Mydata.student;

INPUT id name $ sex $ score;

CARDS;

101 张三 男 98

102 李四 男 87

103 兰兰 女 95

;

RUN;

PROC PRINT DATA=Mydata.student;

RUN;


通过这个简单的DATA步就可以创建一个数据集,同时我将该数据集存放在了刚刚建立的逻辑库Mydata中。


注意,当一个物理位置下的空间不够时,定义多个物理位置的SAS逻辑库就非常有用了,这样在前面的物理路径空间用尽时,SAS会将写入的文件存储到其他物理路径中。具体操作如下:

LIBNAME MyData ('G:\学习\每天坚持写一点点代码\SAS\SAS系统学习\SAS Data'

‘C:\SAS Data’);

这样就将一个逻辑库的物理地址指定到了两个硬盘中。

下期将开始介绍SAS变量、SAS数据集及基本语法。

SAS系统学习之初探相关推荐

  1. SAS系统从入门到放弃?不能放弃,它是数据科学家必备技能

    SAS (Statistical Analysis System)是一个模块化.集成化的大型应用软件系统. 它由数十个专用模块构成,功能包括数据访问.数据储存及管理.应用开发.图形处理.数据分析.报告 ...

  2. 如何系统学习数据分析?

    2019独角兽企业重金招聘Python工程师标准>>> 很多学习数据分析的同学也都有这样一种困惑"为什么学了那么多工具,还是不会数据分析?",原因无外乎两个,一是 ...

  3. 零基础参加java培训的系统学习路线

    ​ 零基础想要学习java技术,那么最好的选择就是参加java培训,进行系统的学习,以下就是小编为大家整理的零基础参加java培训的系统学习路线,希望能够帮助到正在学习java技术的零基础同学. 零基 ...

  4. java学mybatis还用学jdbc吗,mybatis系统学习(二)——使用基础mybatis代替原始jdbc

    mybatis系统学习(二)--使用基础mybatis代替原始jdbc 前言 这一篇笔记的内容应当是建立在上一篇的基础之上,不论是使用的数据表,还是对应的实体类,都在上一篇有过说明. 有兴趣的或者对相 ...

  5. Redis 系统学习目录

    Redis 系统学习目录 1.redis是什么 2.redis的作者何许人也 3.谁在使用redis 4.学会安装redis 5.学会启动redis 6.使用redis客户端 7.redis数据结构 ...

  6. Dubbo -- 系统学习 笔记 -- 示例 -- 参数验证

    Dubbo -- 系统学习 笔记 -- 目录 示例 想完整的运行起来,请参见:快速启动,这里只列出各种场景的配置方式 参数验证 参数验证功能是基于JSR303实现的,用户只需标识JSR303标准的验证 ...

  7. java php mysql_系统学习javaweb13----MYSQL学习(使用PHP、SQL)1

    系统学习javaweb13----MYSQL学习(使用PHP.SQL.mysqladmin)1 (本随笔是自学笔记,我学习的教程来自"菜鸟教程|MYSQL教程",十分感谢!) 目录 ...

  8. python自学流程-Python系统学习流程图,教你一步步学习python

    对于刚开始接触Python的小伙伴来说,没有思路方法,不知道从何开始学习,把软件环境安装好后就不知所措了!接下来我给大家分享下多位大牛倾力打造的python系统学习流程,一个月才设计完的! Pytho ...

  9. .NET系统学习----Globalization Resources

    前言: 在学习如何使用.NET资源文件以及如何开发World-Ready程序之前,我们先通过一个例子来看看为什么要使用资源文件,以及使用它的好处. 假设要在程序中根据当前的Culutre来设置Form ...

最新文章

  1. Functional Language
  2. 开源!100 页机器学习教程全面开放,附完整代码
  3. 使用Lingobit Localizer汉化.net程序(Translate .net program using Lingobit Localizer)
  4. 4.2 算法之数论 9274 beeline(python)
  5. 用matlab设计滤波器实验报告,数字信号出来实验报告--matlab滤波器设计
  6. ndk android studio万年坑
  7. SDL1.3(C语言)程序移植LINUX。。。
  8. 【java笔记】继承
  9. net 调用java_NET调用Java之100-Continue的坑
  10. 语言(文化)代码与国家地区对照表,各国手机号正则
  11. zoom怎么解除静音_Zoom参会者入会后的注意事项
  12. 人生之路1.20代码 第五部分
  13. cad解除块的快捷命令_CAD撤销上一步和恢復下一步的快捷键是什么?
  14. 做SEO优化应该掌握哪些基础知识
  15. 小学三年级上册计算机计划书,小学生计划书
  16. java按顺序生成编号_Java生成有规则的编号
  17. 【线段树】超市促销 rqnoj572
  18. 实现西门子S71200/1500与三菱FX系列PLC通讯
  19. 什么P图软件可以换发型?照片换分享软件分享
  20. How2jcn全站百度云

热门文章

  1. 传世单机版怎么建立服务端?
  2. android 简易的猜拳小游戏
  3. 60个APP LOGO设计
  4. JDK19都出来了~是时候梳理清楚JDK的各个版本的特性了【JDK15特性讲解】
  5. 机器学习-周志华总结
  6. 数字化汗字中仲字如化数字化_如何将旧的电影照片数字化
  7. python股票代码示例_补全股票代码位数的一百种姿势
  8. DFS分布式文件存储系统
  9. iOS开发之Crash分析,以及收集
  10. android 启动视频,android 启动页面全屏播放视频