现在网上对大数据有结构化和非结构化的争论,前者如XML,后者象网页上的文字、图片、音视频等内容。孰优孰劣,在这里我不想去评论它。我想说的是,应该换一个角度来看待这个问题,就是说,无论这些数据无论它外在表象是什么,到了CPU、磁盘层面,它们都是一串数据流,或者称字节数组。如果让这些数据能够被计算机处理和产生价值,它的前提是必须能够被CPU理解和计算。所以,在这个概念基础上,我在Laxcus体系设计里,对数据采用的是一种可格式化(formatable)的处理方案。这个方案简单来说就是这样:数据进入磁盘和CPU前,它们首先做一个预处理,被拆解成CPU理解的,或者能够按照一种即定规则,能够被CPU理解的格式。现在Laxcus的所有数据,都是按照这种方案来采集、整理、处理数据。这样做的好处有两个:1.因为规则明确,体系设计相对就简单了;2.在CPU层面,数据的处理速度会很快。典型的象SQL.LIKE这样模糊检索,在数据库里都很慢,但是在Laxcus分布环境下,这样的数据处理也可以马上获得结果。

我对结构化和非结构数据的理解相关推荐

  1. 结构化、非结构化和半结构化数据

    一直对结构化.非结构化和半结构化数据三个数据类型的概念有点模糊不清,今天特意花点时间网上查找了一番,继而,来此处进行一通总结. ** 结构化数据 ** 结构化数据可以使用关系型数据库来表示和存储,如M ...

  2. 结构化、非结构化和半结构化数据 数据清洗

    结构化数据 **  结构化数据可以使用关系型数据库来表示和存储,如MySQL.Oracle.SQL Server等,表现二维形式的数据.可以通过固有键值获取相应信息.一般特点是:数据以行为单位,一行数 ...

  3. html属于非结构化数据吗,什么是结构化数据非结构化数据和半结构化数据

    什么是结构化数据非结构化数据和半结构化数据以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 结构化数据也称为行数据,是由二 ...

  4. 关于结构化、半结构化、非结构化数据的理解

    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据.心中一直有一个 ...

  5. 关于结构化,半结构化,非结构化数据的理解

    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据.心中一直有一个 ...

  6. 结构化 VS 非结构化

    如果说结构化信息更多的忠实.详实地记录了企业的生产交易活动,是显性的表示,那么 非结构化信息则隐性包含了掌握着企业命脉的关键,隐含着许多提高企业效益的机会. 非结构化数据 非结构化数据库是指其字段长度 ...

  7. 非结构化数据 mysql_Apache Sqoop 结构化、非结构化数据转换工具

    简介: Apache Sqoop 是一种用于 Apache Hadoop 与关系型数据库之间结构化.非结构化数据转换的工具. 一.安装 MySQL.导入测试数据 2.导入测试数据 mysql > ...

  8. 如何理解结构化、非结构化和半结构化数据?

    计算机信息化系统中的数据分为结构化数据.非结构化数据和半结构化数据 1.结构化数据(Structured Data) 定义:结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据 ...

  9. 结构化数据,半结构化数据,非结构化数据非区别和示例

    [结构化数据]:关系型数据库进行存储和管理的数据,可用二维表结构表示. 姓名 年龄 爱好 张三 24 篮球 [半结构化数据]:XML和JSON等,它一般是自描述的,数据的结构和内容混在一起,没有明显的 ...

最新文章

  1. mysql 英文占几个字符_MySQL 数据库 varchar 到底可以存多少个汉字,多少个英文呢?我们来搞搞清楚...
  2. 细谈Ehcache页面缓存的使用
  3. iPhone屏幕大小和适配建议(包括 XR XS XSM )
  4. 利用lay-ui结合ajax实现分页功能(不借助框架,简单易懂)
  5. WildFly 8与GlassFish 4 –选择哪个应用服务器
  6. 3 帮助命令、用户管理、压缩
  7. Bootstrap:弹出框和提示框效果以及代码展示
  8. 2018年python工作好找吗-2018年排名前20的数据科学Python库
  9. 分布式消息队列 NSQ 和 Kafka 对比
  10. 排序算法之一 冒泡排序(C++版本)
  11. Windows2008计算机设置,Windows Server 2008 R2 个人使用优化设置
  12. php学习redis买什么书,redis
  13. 【板栗糖GIS】arcmap—如何通过影像融合提高遥感数据的分辨率
  14. 【动态规划 记忆化搜索】JZOJ_6287 扭动的树
  15. 2021年山东省安全员C证试题及解析及山东省安全员C证模拟考试
  16. c++ 不撞南墙不回头——树形动态规划(树规)
  17. CentOS7安装squid代理服务器
  18. PHP 26个英文字母递增
  19. python画聚类树状图_影像组学学习笔记(36)-聚类树状图Dendrogram的python实现
  20. 为什么是四次挥手不是三次挥手

热门文章

  1. 通过sql跟踪对金蝶K3系统后台数据库执行逻辑跟踪,提取原版SQL语句
  2. css border偏移
  3. 57.超参数概念-2
  4. 制作一个创意的生日快乐网页祝福网站送给心爱的她(HTML+CSS+JS)
  5. Hive2.1.1 下hwi web界面的配置(超详细)
  6. C语言 整理姓名表,将输入的若干姓名按照字典顺序排序输出。
  7. arm平台linux的ethtool配置,ARM-Linux驱动--DM9000网卡驱动分析(四)
  8. 经纬度坐标转平面坐标(C++)
  9. 极光推送接入-客户端
  10. html视频播放器全屏,HTML5 video播放器全屏(fullScreen)方法实例