现在对R感兴趣的人越来越多,很多人都想快速地掌握R。然而,由于目前大部分高校都没有开设R课程,这就导致很多人不知道如何着手学习R。

对于初学R,最常见的方式是看看百度上的简介,遇到不会的地方,就跑到论坛上吼一嗓子,然后欣欣然(得到解答)悲伤(未得到解答)地离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是看书。目前,市面上介绍R语言的书籍已经很多,中文英文都有。那么,众多书籍中,一个菜鸟应该从哪一本入门呢?入门之后如何才能把自己练就成某个方面的高手呢?相信这是很多人心中的疑问。有这种疑问的人有福了,因为笔者将根据自己的经历总结一下R书籍的学习路线图以使大家少走些弯路。

本文分为6个部分,分别介绍初级入门、高级入门、绘图与可视化、计量经济学、时间序列分析和金融等。

1.初级入门

《An Introduction to R》,这是R官网公布的入门小册子,其有中文版,由丁国徽翻译的,译名是《R导论》。《R4Beginners》,这本小册子有中文版应该叫《R入门》。除此之外,还可以去读刘思喆的《153分钟学会R》,对R有一个感性的认识,这个册子收集了R初学者提问频率最高的153个问题。为什么叫153分钟呢?因为最初作者写了153个问题,阅读一个问题花费1分钟时间,全局下来也就是153分钟了。有了这些基础之后,要去读一些经典书籍比较全面的入门书籍,比如《统计建模与R软件》,国外还有《R Cookbook》和《R in action》(中文翻译为《R实战》)等。

最后隆重推荐《R in a Nutshell》,直译是“果壳里面的R”。当然,这是开玩笑的,”in a Nutshell“是英文俚语,意思是“简单的说”。很多技术类书籍都有Nutshell版本,这类书籍一般翻译为”**核心技术手册“,目前,我们已经译好这本书的中文版,预计今年会面世。这本书很不错,深度和广度都超越同类书籍,大家可以从现在开始期待,并广而告知一下!

2.高级入门

读了上述书籍之后,你就可以去高级入门阶段了。这时候要读的书有两本很经典的。《Statistics with R》和《The R book》以及《Modern Statistics with S》。之所以说这三本书高级,是因为这三本书已经不再限于R了,而是结合了数据分析的各种常见方法来写就的,比较系统的介绍了R在线性回归、方差分析、多元统计、R绘图、时间序列分析、数据挖掘等各方面的内容。看完之后你会发现,哇,原来R能做的事情这么多,而且做起来是那么简洁。

读到这里已经差不多了,剩下的估计就是你要专门攻读的某个方面内容了。下面大致说一说。

3.绘图与可视化

亚里斯多德说,“较其他感觉而言,人类更喜欢观看”。因此,绘图和可视化得到很多人的关注和重视。那么,如何学习R画图和数据可视化呢?再简单些,如何画直方图?如何往直方图上添加密度曲线呢?我想读完下面这几本书你就大致会明白了。

首先,画图入门可以读《R Graphics》,个人认为这本是比较经典的,全面介绍了R中绘图系统。该书对应的有一个网站,google之就可以了。更深入的可以读《Lattice:Multivariate Data Visualization with R》,Lattice是R中针对多元数据可视化而开发的一套绘图系统。上面这些都是比较普通的。对应的有比较文艺和优雅的ggplot2系统,看《ggplot2:Elegant Graphics for Data Analysis》,中文版是《ggplot2:数据分析与图形艺术》。这本书理论性较强,实战比较弱。与之互补的要推荐《The R Graphics cookbook》,中文对应的是《R图形可视化手册》,译者是邓一硕、魏太云和肖楠,这本书详细列举了所有常见数据分析图形的绘制方法,适合做工具书。再有就是交互式图形的书了,著名的交互系统是ggobi,这个我已经喜欢多年,关于ggobi的书有《Interactive and Dynamic Graphics for Data Analysis With R and GGobi》,不过,也只是适宜入门,更多更全面的还是去ggobi的主页吧,上面有各种资料以及包的更新信息。

此外,R还推出了shiny和rChart以及rechart等包,可以将图形绘制到网页上,这个可以说是未来的主流,不得不关注。

特别推荐一下,中文版绘图书籍中谢益辉的《现代统计图形》和我们翻译的《R图形可视化手册》。

4.计量经济学

关于计量经济学,首先推荐一本很薄的小册子:《Econometrics In R》,做入门用。然后,是《Applied Econometrics with R》,该书对应的R包是AER包,可以安装之后配合使用,效果甚佳。计量经济学中很大一部分是关于时间序列分析的,这一块内容在下面的地方说。

5.时间序列分析

时间序列书籍的书籍分两类,一种是比较普适的书籍,典型的代表是:《Time Series Analysis and Its Applications :with R examples》。该书介绍了各种时间序列分析的经典方法及实现各种经典方法的R代码,该书有中文版。如果不想买的话,建议去作者主页直接下载,英文版读起来很简单。时间序列分析中有一大块儿是关于金融时间序列分析的。这方面比较流行的书有两本《Analysis of financial time series》,这本书的最初是用的S-plus代码,不过新版已经以R代码为主了。这本书适合有时间序列分析基础和金融基础的人来看,因为书中关于时间序列分析的理论以及各种金融知识讲解的不是特别清楚,将极值理论计算VaR的部分就比较难看懂。另外一个比较有意思的是Rmetrics推出的《TimeSeries FAQ》,这本书是金融时间序列入门的东西,讲的很基础,但是很难懂。对应的中文版有《金融时间序列分析常见问题集》。经济领域的时间序列有一种特殊的情况叫协整,很多人很关注这方面的理论,关心这个的可以看《Analysis of Integrated and Cointegrated Time Series with R》。最后,比较高级的一本书是关于小波分析的,看《Wavelet Methods in Statistics with R》。附加一点,关于时间序列聚类的书籍目前比较少见,是一个处女地,有志之士可以开垦。

6.金融

金融的领域很广泛,如果是大金融的话,保险也要被纳入此间。用R做金融更多地需要掌握的是金融知识,只会数据分析技术意义寥寥。我觉得这些书对于懂金融、不同数据分析技术的人比较有用,只懂数据分析技术而不动金融知识的人看起来肯定如雾里看花,甚至有人会觉得金融分析比较低级。这方面比较经典的书籍有:《Advanced Topics in Analysis of Economic and Financial Data Using R》以及《Modelling Financial Time Series With S-plus》。金融产品定价之类的常常要用到随机微分方程,有一本叫《Simulation Inference Stochastic Differential Equations:with R examples》的书是关于这方面的内容的,有实例,内容详实。此外,风险度量与管理类比较经典的有《Simulation Techniques in Financial Risk Management》、《Modern Actuarial Risk Theory Using R》和《Quantitative Risk Management:Concepts, Techniques and Tools》。投资组合分析类和期权定价类可以分别看《Portfolio Optimization with R》和《Option Pricing and Estimation of Financial Models with R》。

7.数据挖掘

这方面的书有《Data Mining with R:learing with case studies》,《Machine learning for hacks》以及不过《Data Mining with Rattle and R》,书中主要讲了基于Rattle包进行数据挖掘的操作方法,这本书是罕有的全流程数据挖掘工具书,书中详细讲解了从导入数据、清洗数据、数据重整、数据可视化、模型构建、变量选择、模型评价等各个数据挖掘环节,是学习数据挖掘的不二之选。当然,个人比较喜欢Rattle,这本书对应的中文版是《Rattle:R中的数据挖掘GUI》,是由邓一硕、郝智恒、谭丽等翻译的。除了Rattle,Rweka做数据挖掘也很棒。R中数据挖掘方面的包已经足够多了,参考包中的帮助文档就足够了。

出处:http://yishuo.org/r/2012/01/19/how-to-learn-r-by-reading-books.html

R语言书籍的学习路线图相关推荐

  1. 转:邓一硕《R语言书籍的学习路线图》

    现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言. 对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑 ...

  2. [数据挖掘工具] R语言书籍的学习路线图(转自格物堂)

    在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言. 对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到 ...

  3. R语言书籍的学习路线图(转自格物堂)

    [转]http://bbs.pinggu.org/thread-1522238-1-1.html 现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程, ...

  4. 298本R语言书籍免费送!!!

    本人作为R语言爱好者,广泛搜集了关于R语言的书籍,具体包括R语言基础知识.统计学(含生物统计).数据挖掘.计量经济学(时间序列)等,范围广,资料全面,多为可编辑的pdf版本,不少都是各学科领域R语言经 ...

  5. Android开发书籍推荐 学习路线图 资料汇整

    小编注:最近,小编们一直在收集,整理一些针对包括程序员.运营.设计师等在内的系统学习资料,希望给初学者一些参考,也给已经入门的人一些进阶建议,让知识体系更加系统化.当然,这个工作不可能一蹴而就,也相当 ...

  6. 语言 提取列名_学习健明老师发布的R语言练习题的学习笔记(二)

    学习者:骆栢维 题目来源:生信基石之R语言 中级10 个题目:http://www.bio-info-trainee.com/3750.html 备注:本文为笔者学习健明老师GitHub答案代码的学习 ...

  7. R语言︱H2o深度学习的一些R语言实践——H2o包

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- R语言H2o包的几个应用案例 笔者寄语:受启发 ...

  8. 碎片︱R语言与深度学习

    笔者:受alphago影响,想看看深度学习,但是其在R语言中的应用包可谓少之又少,更多的是在matlab和python中或者是调用.整理一下目前我看到的R语言的材料: ---------------- ...

  9. R语言与机器学习学习笔记(分类算法)

    转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...

最新文章

  1. JAVA入门到精通-第71讲-学生管理系统3-增删改查
  2. MySQL8.0启动服务的代码_MySQL8.0服务启动(windows10)
  3. python未将对象引用设置到对象的实例_未将对象引用设置到对象的实例(SystemNullReferenceException)...
  4. MySQL第13天:索引优化
  5. matlab 工业相机 曝光时间_实战 | 相机标定
  6. android10分区镜像,分区和映像  |  Android 开源项目  |  Android Open Source Project
  7. 非递减数列JAVA_C语言实现两个递减数列中寻找某一个数
  8. 30/100. Queue Reconstruction by Height
  9. Codeforces 814C - An impassioned circulation of affection
  10. python人脸实时检测_openCV+python实现人脸实时检测
  11. 洛谷 P3119 [USACO15JAN]草鉴定Grass Cownoisseur (SCC缩点,SPFA最长路,枚举反边)
  12. linux下安装redmine2.5.1详细步骤
  13. PAT (Basic Level) Practice1015 德才论
  14. laravel使用dompdf总结
  15. 软件开发人员的简历项目经验
  16. 大数据核心技术是什么?
  17. 计算机上岗证学校,计算机岗位资格证
  18. 我国历史上各个朝代的都城
  19. 小马模拟器 (支持Android系统)
  20. Nginx常用rewrite跳转重定向实例

热门文章

  1. 汇编语言---大小写字母转换
  2. 利用jvisualvm.exe搞一个关于生产者消费者的另一些纠结的问题
  3. 一个演奏乐曲的趣味小程序
  4. `GoogleAppMeasurement` requires CocoaPods version `>= 1.10.2`, which is not satisfied by your cu
  5. php 自动加载 知乎,wordpress复制文章自动添加版权和原文链接 仿知乎版权功能
  6. chevereto图床程序的安装与迁移
  7. 用模拟退火算法解旅行商问题
  8. java计算机毕业设计springboot+vue地铁站自动售票系统-火车票售票系统
  9. 【Android】Scheme详解
  10. 详解 CAP 定理 Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性)