数据库规范篇:数据库建表规范
基本规范
表结构
- 表和列的名称必须控制在32个字符以内,表名只能使用字母、数字和下划线,一律小写。
- 表名要求模块名强相关,如师资系统采用”sz”作为前缀,渠道系统采用”qd”作为前缀等。
- 建表必须有comment,包括字段和表。
- 数值表主键为id,类型为int或bigint,且为auto_increment
- 反范式设计:把经常需要join查询的字段,在其他表里冗余一份。如industry_name属性在v_industry等表里冗余一份,减少join查询。
- 计算过程中用的中间表,名称必须以tmp_开头。备份表用于备份或抓取源表快照,名称必须以bak_开头。中间表和备份表定期清理。
字段
- 标识表里每一行主体的字段不要设为主键,建议设为其他字段如user_id,order_id等,并建立unique key索引。
- 表中所有字段必须都是NOT NULL属性,业务可以根据需要定义DEFAULT值。
- 表中的自增列(auto_increment属性),使用bigint类型。因为无符号int存储范围为-2147483648~2147483647(大约21亿左右),溢出后会导致报错。
- 文本数据尽量用varchar存储。因为varchar是变长存储,比char更省空间。
索引
- 主键索引的名称以“pk_”开头,唯一键索引以“uq_”开头,普通索引以“idx_”开头,一律使用小写格式,以表名/字段的名称或缩写作为后缀。
- 在建立索引时,多考虑建立联合索引,并把区分度最高的字段放在最前面。
- 建表或加索引时,保证表里互相不存在冗余索引。对于MySQL来说,如果表里已经存在key(a,b),则key(a)为冗余索引,需要删除
字符集
- 数据库本身库、表、列所有字符集必须保持一致,为utf8。
- 前端程序字符集或者环境变量中的字符集,与数据库、表的字符集必须一致,统一为utf8。
DML语句
- SELECT语句必须指定具体字段名称,禁止写成*。
- insert语句指定具体字段名称,不要写成insert into t1 values(…)。
- in值列表限制在500以内。
- SELECT|UPDATE|DELETE|REPLACE要有WHERE子句,且WHERE子句的条件必需使用索引查找。
- WHERE 子句中禁止只使用全模糊的LIKE条件进行查找,必须有其他等值或范围查询条件,否则无法利用索引。
- 减少使用or语句,可将or语句优化为union,然后在各个where条件上建立索引。
- 分页查询,当limit起点较高时,可先用过滤条件进行过滤。如select a,b,c from t1 limit 10000,20;优化为: select a,b,c from t1 where id>10000 limit 20;。
- 建议将子查询SQL拆开结合程序多次查询,或使用join来代替子查询。
业务规范
业务表说明
业务表除了维表(也称字典表)、事实表(也称数据表)之外,通常还包括支持各类功能模块开发的模块数据表、用于存储中间计算过程的各类过程数据表。
其中字典表包括系统字典表、模块字典表,模块表用于存储模块原始数据、模块计算结果数据,中间过程表是临时表,用于一些复杂业务,需要多步计算,产生一些中间过程表,中间过程表要定期清理。
业务数据从维度上一般包含时间维度、地区维度、指标维度、其他特征维度,其中时间维度包含年、月、日、旬、季、小时等,地区维度包含国际、省际、地市等,指标维度包括经济指标、电力指标、能源指标、气象指标等,其他特征维度包括数值类型等。
各类数据表存储经济、电力、能源、气象等主题的多维时间序列数据。
命名规范
基本原则
1 使用英文简写 2 见名知意 3 保证表按模块集中 4 简短优雅
基本规律
指标一般与时间、主题紧密相关,所以字典表一般带时间和主题。
字典表
字典表,也称编码表或维度表,是某个维度、指标的编码表,不仅包含维度名称信息,还包括维度节点层级关系,以节点树结构存储。字典表一般包含的字段有key,name,pk,order,其中order为自增属性,其他可选字段如unit,color等制图时引用的属性,可使图例颜色、单位一致。字典表以code开头。
系统字典表以code_system_开头,命名规则为:code_system_ + 字典类别 + 字典名(英文,不超过10个字母),如 code_system_region_state。
模块字典表以code_开头,命名规则为code_ + 字典名 + 模块名 + 子模块名/标识,如 code_state_energy,并且key必须为外键,引用系统字典表,保持键值一致性。
字典类别包括:地区编码: region,类型编码:type, 指标编码:indicator,时间编码:date。其中:
系统地区编码表:国家编码表;省份编码表;地市编码表;
类型编码表:数值类型、时间类型、各类口径等;
指标编码表:经济指标、电力指标、能源指标、行业等;
日期编码表:年、月、日、季、旬、周、小时等;
数据表
数据表,也称数值表、立方体数据,符合笛卡尔积特性,其中含有两个及以上维度列,作为外键引用维度表key,一个及以上字段为数值列,表示由维度表定义的数值项。如各省年度宏观经济数据,则隐含的维度包括省份、时间、指标、值类型(可选),包含的数值列为数值项。
数据表以value_system_开头,命名规则为 value_system_ + 主题 + 地区 + 时间 , 如各省年度宏观经济数据命名为:value_system_economic_province_year,将主题提前,保持各个主题数据集中。
模块数据表以v_开头,命名规则为: value_ + 模块 + (子模块) + 地区 + 时间 ,如浙江日负荷数据,命名为: value_electric_load_zhejiang_day
字典表字段
字段 |
字段名称 |
字段类型 |
唯一 |
非空 |
备注 |
key |
键值 |
int |
是 |
是 |
唯一 |
name |
名称 |
varchar(64) |
否 |
是 |
|
pk |
父键值 |
int |
否 |
否 |
根节点的pk为空,其他节点的pk引用父节点key |
order |
顺序 |
int |
是 |
是 |
主键 |
unit |
单位 |
varchar(20) |
否 |
否 |
可拆分多个,可选 |
color |
颜色 |
varchar(20) |
否 |
否 |
可拆分多个,可选 |
时间字段
时间字段包括:年、月(年月)、日(年月日)、季(年季)、旬(年月旬)、小时(年月日-小时),其中:年、月、日采用日期类型存储,默认年份所在月日为1月1日,即2020年为 2020-01-01,默认月份所在日为1日,即2020年7月为 2020-07-01。
季、旬、小时,采用日期 + 日期类型 存储, 季采用 年 + 季 , 旬采用 月 + 旬 , 小时采用 日 + 小时。
字段 |
字段名称 |
字段类型 |
备注 |
year |
年 |
date |
2020年即 2020-01-01 |
month |
月 |
date |
2020年2月即 2020-02-01 |
day |
日 |
date |
2020年3月5日即 2020-03-05 |
season_key |
季 |
int |
键值为1~4,对应春夏秋冬 |
ten_day_key |
旬 |
int |
键值为1~3,对应上中下旬 |
hour_key |
时 |
int |
键值为0~23,对应24小时 |
- 维度字段:
采用int类型,建表时标明外键,并引用字典表。命名为维度名 + ‘_key’;
- 维度名称字段:
如需冗余 维度名称,防止多表join,可在数值表中加上维度名称字段,采用varchar(200) 类型,命名为:维度名 + ‘_name’;
- 数值字段:
采用float类型,默认为null,如果只有一列,命名为 value, 如果有多列,命名为: v_ + 数据项名;
命名实例
- 地区字典表
表名(中文) |
表名(英文) |
备注 |
地区编码表 |
code_system_region |
- 时间字典表
表名(中文) |
表名(英文) |
备注 |
季节编码表 |
code_system_season |
全年、春夏秋冬,0~4 |
小时编码表 |
code_system_hour |
24小时,0~23 |
旬度编码表 |
code_system_ten_day |
上中下旬,1~3 |
- 类型编码表
表名(中文) |
表名(英文) |
备注 |
值类型编码表 |
code_system_type_value |
当期、累计、当期同比,累计同比,0~3 |
电力口径编码表 |
code_system_type_caliber |
调度、全社会、统调,0~2 |
- 数据表名
字段 |
字段名称 |
字段类型 |
备注 |
module |
主题 |
varchar(64) |
经济、电力、能源、气象(4个) |
date |
日期类型 |
int |
年月日季旬周时(7个) |
region |
地区 |
varchar(64) |
国家(约200)、省份(34)、地市(约300),一般约10个主要国家、5个省份、某省地市(约10~20个) |
table_name |
表名 |
varchar(64) |
最多4*7*16张表,一般约30~60张表 |
数据库规范篇:数据库建表规范相关推荐
- mysql数据库:最全MySQL数据库设计建库、建表规范及经验(踩过坑才能积累经验!)
废话 这两天还是在做刚接手的小项目,也是第一次一个人负责整个项目的所有流程,最后交给客户. 当自己去接触项目时,真的会踩很多很多坑,当然解决了就是很大的进步与成长.昨晚我就意识到自己给自己留了一个大坑 ...
- 阿里巴巴开发手册:Mysql建表规范
建表规范 布尔类型的字段,使用unsigned tinyint 建议所有非负数字段使用unsigned 表名.字段名必须使用小写字母或数字: 表名不使用复数名词. 唯一索引名为 uk_字段名:普通索引 ...
- mysql约束建表规范_MySQL 建库建表规范
1.约束 1.PrimaryKey(PK)主键 特点:唯一 + 非空,一张表中只能有一个主键约束,一般是一个数字列,最好是无意义的. 2.NOT NULL 非空 特点:不能为空,建议在MySQL中,业 ...
- 炫“库”行动-人大金仓有奖征文—谈谈oracle建表规范
[本文正在参与炫"库"行动-人大金仓有奖征文] 活动链接https://bss.csdn.net/m/topic/kingbase 前言: 今天突然想把工作几年在oracle建表相 ...
- Mysql的建表规范与注意事项
一. 表设计规范 库名.表名.字段名必须使用小写字母,"_"分割. 库名.表名.字段名必须不超过12个字符. 库名.表名.字段名见名知意,建议使用名词而不是动词. 建议使用Inno ...
- mysql 创建表字段长度范围_Mysql的建表规范与注意事项
一. 表设计规范 库名.表名.字段名必须使用小写字母,"_"分割. 库名.表名.字段名必须不超过12个字符. 库名.表名.字段名见名知意,建议使用名词而不是动词. 建议使用Inno ...
- SQL数据库实战(含建表数据和查询案例)
Oracle数据库安装的时候会自带一个练习用数据库(其中包含employee表,后来版本中此表改名为emp): 首先在安装过程中应该有个选项"是否安装实例表"(完全安装模式下默认是 ...
- mysql数据库 头像字段_模仿陌陌八张头像的数据库,应该如何建表才合适?
我想大家都已经看过我以前的问题了.就是吐槽创业好难.自己能力不足,基本上我获得的经验都是segmentfault上面一个个提问得来的.在这里,我要感谢哪些帮助过我的人,不管是多么幼稚的问题都会有人热心 ...
- SQL数据库常用约束及建表、插入数据时注意事项
1.数据库常用约束 primary key --主键约束 foreign key (references) --外键约束 unique --唯一值约束 default --默认值约束 check -- ...
最新文章
- 小R SLAM机器人树莓派3b+ ROS kinetic 环境搭建笔记
- java多线程中的join方法详解
- python支付程序源码_python项目中实现支付宝网页支付
- 数据库的定义、关系型数据库的四种约束。。
- Auty 2017——WebMonitor接口本地检测平台
- 大数据量生成工具源代码(Delphi)
- xpath定位中详解id 、starts-with、contains、text()和last() 的
- [转]Effective C#原则4:用条件属性而不是#if
- windows上安装使用mySql
- 团队作业4——第一次项目冲刺(Alpha版本)2017.4.23
- vue生命周期整理学习
- Aurora-------在 MSOffice 内输入 LaTeX 公式的很好用插件
- (12.05)Java小知识!
- Python实战(07):使用selenium刷访问量
- 建议直接收藏,阿里巴巴开源15个顶级Java项目
- 移动端百度强引蜘蛛SEO工具
- 众达两化融合贯标日记08~培训23001标准
- 系统管理中的三大利刃
- java计算机毕业设计科普网站源码+mysql数据库+系统+lw文档+部署
- SSD的预留空间OP介绍