数据集链接CHB-MIT Scalp EEG Database v1.0.0

如何将edf文件中的数据提取出来请参考大佬文章CHB-MIT波士顿儿童医院癫痫EEG脑电数据处理(一)_arbitrary19的博客-CSDN博客

将数据提取出来后,数据是一个[23,921600]的数组(23通道,3600秒,256Hz采样频率)。在数据集中,癫痫发作的时间是在每一个被试者的summary.txt中展示的,如下图

故需要将癫痫对应的时间片截取出来,函数如下:

def generate_data_label(summary_txt_filename):with open(summary_txt_filename) as f:summary_txt=f.read()pattern_string="File Name: .+\nFile Start Time: .+\n.+\n.+\nSeizure Start Time: \d{1,4} seconds\nSeizure End Time: \d{1,4} seconds"# pattern=re.compile(pattern1_string)string_list=pattern1.findall(summary_txt)result={}for index, item in enumerate(string_list):file_pattern = re.compile("File Name: (chb\d{2}\w?_\d{2}\+?\.edf)\n")time_pattern = re.compile("Seizure \d? ?Start Time: (\d{1,5}) seconds\nSeizure \d? ?End Time: (\d{1,5}) seconds\n?")file_name = re.findall(file_pattern, item[0])file_name=file_name[0]times = re.findall(time_pattern, item[0])for t in times:start_time = int(t[0])end_time = int(t[1])if file_name in result.keys():result[file_name].append((start_time,end_time))else:result[file_name]=[(start_time,end_time)]return result

通过正则表达式提取出对应的文件名,开始发作时间,结束发作时间。

测试代码如下:

result=generate_data_label("chb16\\chb16-summary.txt")
for (k,v) in result.items():print("文件名为{},对应时间列表为{}".format(k,v))

结果如图(文件名:chb16-summary.txt):

需要注意的是 在该数据集的summary文件中,存在着大量的bug....比如某些文件在某些地方会多一个空格,有些地方是23通道,有些地方是22/24/28通道,没什么规律,但出现这些情况的文件不多,我也就懒得专门弄了,有兴趣的可以自己搞一下。

波士顿儿童医院CHB-MIT癫痫数据集预处理-提取发作时间相关推荐

  1. 癫痫脑电数据集-波士顿儿童医院

    波士顿儿童医院收集的癫痫脑电数据,发表于2010年,数据量比较大,适合利用机器学习深度学习做癫痫脑电分类,需要的自取.可以后台下载! 数据集地址:https://physionet.org/conte ...

  2. 波恩大学癫痫脑电和波士顿儿童医院脑电信号数据集下载

    1.德国波恩大学癫痫脑电数据集下载,这里我是通过网上找资料,花了2元钱下载的 该数据集由5个子数据集构成Set A.Set B.Set C.Set D.Set E(下面是解释) 每一个子集包含100个 ...

  3. CHB-MIT波士顿儿童医院癫痫EEG脑电数据处理-癫痫发作预测(六)

    CHB-MIT波士顿儿童医院癫痫EEG脑电数据处理-癫痫发作预测(六) 导入需要的包 各功能模块 数据集导入 模型训练 训练结果 保存模型 测试结果 导入需要的包 import numpy as np ...

  4. CHB-MIT波士顿儿童医院癫痫EEG脑电数据处理-通道选择(五)

    CHB-MIT波士顿儿童医院癫痫EEG脑电数据处理-通道选择(五) 概述 通道选择模型 通道选择 LightGBM模块代码 LightGBM模型训练 概述 由于癫痫发作时不是整个大脑区域都有相关的反映 ...

  5. PyTorch中的MIT ADE20K数据集的语义分割

    PyTorch中的MIT ADE20K数据集的语义分割 代码地址:https://github.com/CSAILVision/semantic-segmentation-pytorch Semant ...

  6. R语言泊松回归(poisson)模型案例:基于robust包的Breslow癫痫数据集

    R语言泊松回归(poisson)模型案例:基于robust包的Breslow癫痫数据集 目录 R语言泊松回归(poisson)模型案例:基于robust包的Breslow癫痫数据集 #数据加载

  7. Criteo数据集预处理

    Criteo数据集介绍和下载 数据集包含各个特征取值和点击率,共39个特征,其中13个数字型特征,26个类别特征.Criteo是CTR模型的benchmark数据集,曾被用于kaggle竞赛. (Ka ...

  8. 掌纹识别python 预处理-提取ROI

    掌纹识别python 预处理-提取ROI 本项目使用香港理工大学的掌纹公开库(v2) 参考资料: https://zhuanlan.zhihu.com/p/365301097 https://ieee ...

  9. kddcup99预处理matlab,KDD CUP99数据集预处理

    KDD CUP99数据集预处理 发布时间:2018-05-29 08:41, 浏览次数:1410 , 标签: KDD CUP KDD CUP99数据集预处理 1.数据集下载:http://kdd.ic ...

最新文章

  1. 电子科大博士生杨超火了!2年实现Science+Nature一作双杀
  2. 将Centos的yum源更换为国内的阿里云源
  3. 串口ISPHUB制作
  4. GraphQL 进阶: 基于Websocket的实时Web应用开发
  5. 如何切换默认python版本_Debian中如何切换默认Python版本
  6. springboot集成rocketmq消费者
  7. import numpy as np_纪录27个NumPy操作
  8. 编程之美--高效率算出1的数目之扩展问题
  9. html——原生js与jquery创建元素节点区别
  10. 判断两字符串是否为逆序
  11. html+css+JavaScript(菜鸟教程版本)学习笔记7.25
  12. 将长方形转换为正方形
  13. 《阿甘正传》英文原版剧本(场景+台词)(看电影学英语的最佳材料)
  14. 波士顿房价预测实验报告
  15. win7系统怎么查看电脑配置,win7电脑系统配置查看
  16. Appium+python自动化(四十一)-Appium自动化测试框架综合实践 - 即将落下帷幕(超详解)
  17. 小米NFC手机 手环 复制加密IC门禁卡
  18. JSP基本语法、3个编译指令、7个动作指令、9个内置对象
  19. 思科模拟器:ethernet channel---以太网通道
  20. 2011年3月《震痛•震恫•震动》

热门文章

  1. 如何一键批量下载Iconfont图标
  2. oracle使用tmpfs,使用tmpfs提高性能
  3. quarkus实战之一:准备工作
  4. 读五月的仓颉大佬博文有感
  5. css 预编译处理器 - Stylus
  6. 【微服务】Day17(酷鲨商城前台业务总结、布隆过滤器、Docker)
  7. 阿波罗进阶版-6-地图的生产和采集
  8. 苹果Mac自带词典完美扩充
  9. 仗剑走天涯,做个前端独行侠
  10. mysql nullpoint_访问数据库时遇到NullPointer Exception