20190425 看数据统计和数据挖掘让我写了一篇杂文
最开始做数据的时候,你认为你是一个做数据的,你只是写写SQL,其实这有很多的方向和发展,不要空了就玩手机,很多人的区别就在于你有没有去不断努力,太多的人认为上年纪了学不快,学不进去了,他们只是精力不在此,我倒是很欣赏那些哪怕60岁依旧在进步的人,无论什么方式,什么速度,什么内容都值得尊敬,值得钦佩,人贵早闻夕死,吾愿足以,也许我能力有限,学习能力也有限,甚至理解力也低于很多人,但我只做我自己,只愿自己今天知道的会的比昨天多,每天总结今天做了什么。
也许每个人起点不同、知识结构不同、方向不同、但你是否真的执着于你的选择并且坚持下去,坚持源于热爱,源于也许没有结果但你并不害怕
1.SQL --- > 统计数据,自带聚集函数,数学公式---> 然而你得到的技能是SQL-->你可以思考的是不再是记忆这些表和数据栏位---> 你应该看一下这些表的构成它关系到一个业务模型,无论应用系统模型,还是分析系统---> 应用系统模式是产生和收集这些数据的地方---> 分析系统是统计分析数据的地方
2.那么在分析系统中 ---> 很多问题都是由于时差导致的,那就是从应用系统到分析系统的中间ETL 数据同步或者接口平台同步,方式不一,由于数据量太多所以往往不是全量同步(会有性能问题),往往是增量同步(会出现遗漏补漏问题),再有就是再生成数据,数据在某个点某个时间的状态不同,生产的数据也不同(会出现数据不同)
3.在分析系统对应的数据仓库中做数据加工 ---> 这里提高的是你对仓库的理解和构想以及对数据的应用,除了用SQL 去加工那么可以用Python pandas去处理,除报表呈现外
应该对比的是它们的区别功效意义,性能
4.那么统计和挖掘的区别
统计大多数用于分析系统
挖掘更多的时候用于推荐系统
这两个,我总感觉没有特别明显的界线
统计是为了得到行业趋势,统计分析是为了从数据中得到知识,统计更多的是体现现有的数据的状态,反应异常原因和情况,为的的避免一些不必要问题的出现降低后期损失,提高产能(规避风险,作为未来发展的参考)
挖掘也是如此,挖掘是为了得到更多用户的喜好,更好的服务于客户而不是去暴露客户的隐私,更需要注意的区别在于产品和产品之间可能产生的隐藏关系
(从电商来看,更多的是发现,通过算法去计算可能性)
总得来说,统计和挖掘针对的问题不太相同,但有相辅相成的作用,无论上面那种都是比拼数学能力!
有些人很成功,因为他们总是像一个方向努力,从初级程序员-->到中级-->到高级-->再到项目经理,但很多人都会停留在项目经理很多年很多年,为什么呢,因为他们走管理层,一个完整的项目他们已经知道如何去完成,并能很好的管控和指点下面的人去完成,计划好项目工时
有人说觉得自己做不到项目经理,原因有两种,一种没有自信,一种没有容人之量,做技术的人大多恃才傲物,更有的脾气古怪,不够谦和,也许会被理解为谦和的人没什么能力不敢高傲,除非你能在技术上折服对方,能谦虚而不断进步的少有,能不安于现状的也少,所谓的舒适区,就像温水煮青蛙。时不时的问一下自己有没有被煮熟
很多人喜欢讲述自己过去的种种能力种种成就,能把很小的事情讲得很厉害,当然我也很佩服这种表达能力,比如当对现状不满时,总会还念过去的公司,过去自己已经得到的认同,这会阻碍进步的心,空杯的心态很少有人能做到,会逐渐失去重新开始的勇气,当然在新的公司新的人群中要得到认同确实实属不易,这也是为什么很多人不轻易更换工作的原因,因为你要去符合别人的规则。而不是别人适应你的规则
转载于:https://www.cnblogs.com/Soar-Pang/p/10766436.html
20190425 看数据统计和数据挖掘让我写了一篇杂文相关推荐
- 看完了小米12发布会,连夜写下这篇JavaScript笔记
JavaScript 关于JavaScript的基本内容了解 基础语法 基本对象 BOM DOM 事件监听机制 常见的事件 关于JavaScript的基本内容了解 一.概念: 一门客户端脚本语言 ...
- 她回顾过去的学习生活,印象最深刻的并非是收获荣耀的高光时刻, 而是在“看文献、做科研、写论文”循环中推进的每一步...
一不留神又到期末了,热搜上都在数着哪个学校的寒假更长,而我只想问,科研人的论文都写完了吗? 反正我是恨不得克隆十个自己,一个泡在实验室盯实验结果,一个去盯基金申请,一个去写月底要送审的稿子..... ...
- 数据产品经理基础技能:数据需求说明文档怎么写?
公众号后台回复"图书",了解更多号主新书内容作者:草帽小子来源:一个数据人的自留地 作者介绍 @草帽小子 数据产品经理一枚~ 用户画像.埋点.指标体系.BI.广告投放等系列文章作者 ...
- 好文推荐 | 从数据的属性看数据资产
编辑说 数据资产化是发挥数据要素价值.培育数据要素市场的必经之路.发展数据要素市场是未来数字经济健康.快速.持续发展的基础,而数据资产化是数据成为生产要素的前提.数据资产是一类新的资产类别,对其涉及的 ...
- 关于App的数据统计和分析
原文地址:https://blog.csdn.net/whywhom/article/details/69963119 "一切都是数据"将成为其必然的趋势.经过了几年的发展和积累, ...
- 从数据的属性看数据资产
从数据的属性看数据资产 朱扬勇, 叶雅珍 复旦大学计算机科学技术学院,上海 201203 上海市数据科学重点实验室,上海 201203 东华大学计算机科学与技术学院,上海 201620 摘要 ...
- 如何入门大数据(数据挖掘方面)
可供工程师选择的大数据岗位 从雇主需求看,如何发掘自己转岗优势 为转岗工程师提供的建议 ps:本回答较长,读完约要6分钟. 可供工程师选择的大数据岗位 大数据平台/开发工程师 他们的工作重心在于数据的 ...
- 一篇让你深度思考的文章|大数据与数据挖掘的相对绝对关系 大数据
数据不是信息,而是有待理解的原材料.但有一件事是确定无疑的:当NSA为了从其海量数据中"挖掘"出信息,耗资数十亿改善新手段时,它正受益于陡然降落的计算机存储和处理价格. 麻省理工学 ...
- 使用 MitmProxy 自动抓取微信公众号阅读数、点赞和再看数据
文 | 某某白米饭 来源:Python 技术「ID: pythonall」 某天接到一个需要抓取某某微信公众的所有历史文章的阅读数.点赞和再看数据的需求. 为了解放双手,就用 Python 代码撸一个 ...
最新文章
- AMAB interconnector PL301(二)
- 中兴存储服务器 操作系统,中兴新支点服务器操作系统:企业级的国内服务器操作系统...
- C++线程同步之事件(生产者与消费者问题)
- python汉语读音_【学习】python 汉语转拼音
- kernel 3.2.0 上加入自己的板级文件
- 【详细原理】蒙特卡洛树搜索入门教程!
- HTML5 Canvas雨滴下落动画 超逼真
- 数据结构算法之关键路径
- 【自学Python:Day3】放假的心该怎么冷静下来学……
- Zoomit的用法总结
- DDL、DML和DCL的理解(1、总述)
- 参加河北省研究生数学建模比赛有感
- 锐捷ac怎么发现局域网ap_锐捷AC配置步骤备忘
- 503 service unavailable 错误怎么解决?503 service unavailable 错误的解决方法。
- elementui3
- 信号与系统(day10)补充
- Grail:Uber是如何管理大规模基础设施的
- 达人评测 rtx3050ti和gtx1650ti哪个好 3050ti和1650ti对比差多少
- 企业OA办公系统有哪些?
- oracle中loder,Oracle Sql Loader的学习使用