零基础逐句复现SCI一区论文,从NHANES医学数据分析开启研究之路
零基础逐句复现SCI一区论文
从NHANES医学数据分析开启研究之路
目录
零基础逐句复现SCI一区论文
从NHANES医学数据分析开启研究之路
1 你离SCI一区并不遥远
2 读论文,逐句复现
2.1 获取数据
2.2 逐句复现
3 学习总结
3.1 医学数据分析小结
3.2 对选题的启发
3.3 选刊知多少
课程资料获取
bilibili:熊大学习社 熊大学习社的个人空间_哔哩哔哩_Bilibili
Gitee开源:ioter: 玩转物联网
CSDN玩转物联网专栏文章:https://blog.csdn.net/shx13141/category_11669532.html
微信公众号:熊大学习社
1 你离SCI一区并不遥远
NHANES数据库简介
National Health and Nutrition Examination Survey
美国国家健康与营养调查
NHANES - National Health and Nutrition Examination Survey Homepage
看一下NHANES相关的研究成果。
Greenmedical,朱仲鑫一两年发了12篇
(NHANES[Title/Abstract]) AND Zhongxin Zhu[Author]
GeenMedical 根哥学术
Can waist circumference be a predictor of bone mineral density independent of BMI in middle-aged adults?
R语言简介,数据分析工具;RStudio环境。
软件安装
链接:百度网盘 请输入提取码 提取码:1111
-
轻松,简单,易上手。
快捷键
赋值<-,Alt+-
管道|>,Ctrl+M
删除指定行,Ctrl+D
注释,Ctrl+/
运行指定行,Shift+Enter
运行全部,F5
环境准备,设置Packages服务器
安装devtools
install.packages("devtools")
你的水平与SCI一区的距离并不遥远。
annals of internal medicine,一区顶刊,51.598/Q1
2 读论文,逐句复现
2.1 获取数据
第一种方法:
https://wwwn.cdc.gov/Nchs/Nhanes/1999-2000/DIQ.XPT
https://wwwn.cdc.gov/Nchs/Nhanes/2001-2002/DIQ_B.XPT
https://wwwn.cdc.gov/Nchs/Nhanes/2003-2004/DIQ_C.XPT
数据说明:DEMO
第二种方法
# * 加载库-----library(dplyr)library(survey)# Download & Read SAS Transport Files# Demographic (DEMO)download.file("https://wwwn.cdc.gov/nchs/nhanes/2013-2014/DEMO_H.XPT", tf <- tempfile(), mode="wb")DEMO_H <- foreign::read.xport(tf)[,c("SEQN","RIAGENDR","RIDAGEYR","SDMVSTRA","SDMVPSU","WTMEC2YR")]download.file("https://wwwn.cdc.gov/nchs/nhanes/2015-2016/DEMO_I.XPT", tf <- tempfile(), mode="wb")DEMO_I <- foreign::read.xport(tf)[,c("SEQN","RIAGENDR","RIDAGEYR","SDMVSTRA","SDMVPSU","WTMEC2YR")]# Mental Health - Depression Screener (DPQ) download.file("http://wwwn.cdc.gov/nchs/nhanes/2013-2014/DPQ_H.XPT", tf <- tempfile(), mode="wb")DPQ_H <- foreign::read.xport(tf)download.file("http://wwwn.cdc.gov/nchs/nhanes/2015-2016/DPQ_I.XPT", tf <- tempfile(), mode="wb")DPQ_I <- foreign::read.xport(tf)
第三种方法
离线数据,已打包;设置数据库目录即可;
2.2 逐句复现
5种血细胞
wbc,白细胞
Neu,中性粒细胞
Leukocyte,白细胞
Lymphocyte,淋巴细胞
Hemoglobin,血蛋白
Platelet,血小板
课程内容
1 你离SCI一区并不遥远
2 数据下载、合并及基本情况
3 加权线性回归
4 Table1 不同性别、年龄、种族血细胞计数统计、差异性分析
5 Appendix Table 1
6 Appendix Table 2
7 Appendix Table 3 血细胞分段
8 Table 2 吸烟与不吸烟的差异性
9 Appendix Table 4 中性粒低疾病分析
10 Table3
11 Table 4
12 Figure 1
13 Figure 2
14 学习总结
3 学习总结
3.1 医学数据分析小结
3.1.1 数据下载,我需要的是哪些数据表
(1)多借鉴已发表论文的思路;
(2)在NHANES中搜索和查阅;
(3)先做出部分数据,后改进。
3.1.2 数据分析方法,常用的有哪些
(1)对缺失数据的分析,体现严谨性。
(2)svyglm,加权线性回归,看指标的差异性。
# 加权,重新计算nhsd$eth <- factor(d$eth, levels = c("white","black","other","mexican"))nhs <- svydesign(data=d, ids=~sdmvpsu, strata = ~sdmvstra, weights=~nhs_wt, nest = TRUE)svyglm(wbc ~ eth + age + sex, design = nhs) |> summary()
(3)svyby
亚组分析,求均值和置信度。
res <- svyby(~wbc, ~age18+sex+eth, nhs, svymean , vartype="ci")
求数量
res2 <- svyby(~Neu3,~age9+Neu3, subset(nhs,d$eth=='black'), unwtd.count)
(4)unlist+paste+write.xlsx,数据组合成约定格式,并保存数据。
注意数据合成后,要和之前的原始数据进行对比,确保格式和排列准确。
# wbcres <- svyby(~wbc, ~age18+sex+eth, nhs, svymean , vartype="ci") res# 数据展开t1 <- round(as.numeric(unlist(as.data.frame(res)[4], recursive = FALSE,use.names = TRUE)),1)t2 <- round(as.numeric(unlist(as.data.frame(res)[5], recursive = FALSE,use.names = TRUE)),1)t3 <- round(as.numeric(unlist(as.data.frame(res)[6], recursive = FALSE,use.names = TRUE)),1)# 按照约定格式拼接t <- paste(t1, '(', t2, '-', t3, ')',sep='',collapse=NULL)t <- as.data.frame(matrix(data=t, ncol=4, byrow=FALSE, dimnames =NULL))# 设定行名和列名rownames(t) <- c('Male <18','Male >=18', 'Female <18','Female >=18')colnames(t) <- c('black','white','mexican','other')# 保存数据结果t <- t[1:3]write.xlsx(t,'D:\\papaers\\NHANES\\proj\\nhanesDo\\Table1 wbc~age18+sex+eth.xlsx', sheetName='1', append=TRUE, rowNames = TRUE)t
(5)指标细分,如年龄分段、指标分布。
# 年龄分段bu_x <- d$agelabels <- c("1-2","3-5","6-8","9-11","12-14","15-17","18-24","25-34","35-44","45-54","55-64","65-74",">=75")breaks <- c(0,2,5,8,11,14,17,24,34,44,54,64,74,100)d$age13 <- cut(bu_x,breaks = breaks, labels = labels, right = TRUE)# 序列顺序d$age13 <- factor(d$age13, levels = c("1-2","3-5","6-8","9-11","12-14","15-17","18-24","25-34","35-44","45-54","55-64","65-74",">=75"))
(6)求个数和概率
# 第一种方法,数据summarise(group_by(d,age13,eth),number=n()) |> dcast(age13~eth,value.var = 'number')# 第二种方法,数据和比例age13df <- as.data.frame(table(age13=d$age13[d$eth=='black']))transform(age13df,FreqRate = round(prop.table(Freq)*100,2))
3.2 对选题的启发
(1)模仿顶刊,了解研究的套路,进而确定研究主题。
(2)阅读相关领域专家教授和导师的顶刊文章,了解领域动向。
3.3 选刊知多少
(1)投稿准备
投稿需要准备的材料:手稿、checklist、图、表;还有一个很重要,Research in context.
1.What is already known about this subject? (maximum of 3 bullet points)
2.What is the key question? (one bullet point only)
3.What are the new findings? (maximum of 3 bullet points)
4 How might this impact on clinical practice in the foreseeable future? (one bullet point only)
(2)选择期刊
建议:从看过的文章中找;从参考硕博论文的发表文章中找;用一些辅助软件和网站。
Endocrine Connections,Endocrine Connections_影响因子(IF)_中科院分区_SCI期刊投稿经验_爱科学,3.221/Q3,内分泌学与代谢,1300美刀
Diabetes Metabolic Syndrome and Obesity-Targets and Therapy,DIABET METAB SYND OB,3.249/Q3
DIABETES OBESITY & METABOLISM,影响因子6+,最快1个月可接受,无版面费,官网https://dom-pubs.onlinelibrary.wiley.com/journal/14631326
介绍可见:影响因子6+,最快1个月可接受,无版面费!|文章|论文|稿费|diabetes_网易订阅
International Journal of Endocrinology,2.803/Q4
官方网站:www.hindawi.com/journals/ije/
投稿网址:mts.hindawi.com/login/
annals of internal medicine,一区顶刊,51.598/Q1
Journal of the American Heart Association,6.106/Q2
课程资料获取
课程资料包括NHANES离线数据库、R语言复现代码、Excel折线图、经典论文、R语言环境软件包、讲义。关注公众号“熊大学习社”,回复“零基础复现SCI一区”,可获得资料链接。
感谢您的学习,希望您有所收获。您的一键三连是我最大的动力。
更多的学习分享,关注B站熊大学习社。
零基础逐句复现SCI一区论文,从NHANES医学数据分析开启研究之路相关推荐
- SCI一区论文:基于WiFi信号的病毒存活期内密切接触者追踪
自2019年底开始,新冠疫情的爆发对全球人民的健康与世界经济的发展造成了极大的威胁.及时追踪并隔离病毒的密切接触者在抑制疫情的蔓延中发挥着非常重要的作用.以往密切接触者追踪的方法通常关注与确诊患者有过 ...
- Android零基础入门第7节:搞定Android模拟器,开启甜蜜之旅
原文:Android零基础入门第7节:搞定Android模拟器,开启甜蜜之旅 在前几期中总结分享了Android的前世今生.Android 系统架构和应用组件那些事.带你一起来聊一聊Android开发 ...
- 计算机专业sci二区论文难吗,通信专业二区sci难吗
我们知道sci被划分成了四个分区,从一区到四区的刊物投稿难度依次降低.通信专业二区sci难吗?二区所收录的通信专业期刊有很多,投稿难度不一,而且针对不同的作者和不同的情况,每个人都会有不同的感受,以下 ...
- SCI三区论文大修笔记(已录用)
本人5月份往Journal of Process Control期刊投了一篇论文,是基于深度学习图像序列预测的.前几天收到一审结果,大修.两个审稿人给了几篇参考文献,此贴专门用来做笔记方便自己查阅. ...
- 零基础小白复现Java 若依项目
若依项目 1 概述 2 环境配置 3 打包项目 4 导入项目 5 配置项目数据库连接,数据源配置 6 然后运行代码 1 概述 RuoYi-Vue 是一个 Java EE 企业级快速开发平台,基于经 ...
- python从爬虫到数据分析项目_零基础学习Python web开发、Python爬虫、Python数据分析,从基础到项目实战!...
随着大数据和人工智能的发展,目前Python语言的上升趋势比较明显,而且由于Python语言简单易学,所以不少初学者往往也会选择Python作为入门语言. Python语言目前是IT行业内应用最为广泛 ...
- 天池零基础入门NLP竞赛实战:Task1Task2 数据读取与数据分析
Task1&Task2 数据读取与数据分析 赛题数据是文本数据,每个新闻是不定长的,使用csv格式进行存储.因此可以直接用Pandas完成数据读取的操作. import pandas as p ...
- 软考论文有哪些写作技巧?这份软考论文攻略让你开启高分之路
软考的论文考试时间是120分钟,每个题目都会有详细具体的要求,因此选择自己要写的论文相当重要,其次就是掌握好考试时间,这里给大家分享一些写作技巧. 第一步:利用考前5分钟发卷的时间,填写好相关资料,利 ...
- A novel framework for detecting social bots with deep neural networks and active learning(SCI一区)
目录 摘要 1 绪论 1.1. Social bots in OSNs 1.2. Challenges 1.3. Contribution and organization 2 相关工作 2.1. G ...
最新文章
- python中将一个全部为int的list 转化为str的list
- Bochs调试Linux内核6 - 启动过程调试 - 跳到bootsect引导程序执行
- 卜晓军:IBM的大数据战略全面升级
- java guava json文件_Json解析文件位置的问题
- 不怕!在家也能过好情人节 ——用数学浪漫表白的N种方法
- 收文处理和发文处理的环节_集气罩的设计是气体净化、废气处理系统设计的重要环节...
- 相对URI以及base的设置
- 3d相册 html 代码_女朋友生日,我送她网页相册,她感动的哭了(文中有惊喜)...
- Redis学习总结(4)——Spring Data操作Redis
- web响应式图片设计实现
- Corosync与Pacemaker实现nfs作为共享存储的MySQL高可用
- PPT演讲放映技巧__备注的妙用
- android内核中Kconfig及如何加自己的驱动
- C# 判断程序是否已经在运行
- php中的代码延迟函数sleep() usleep()
- oracle四大索引类型,各种Oracle索引类型介绍
- 关于grpc 的keepalive 的一些知识
- 国内宠物保险“不受宠”背后,这门生意该如何做好?
- Python基础包含哪些内容?学习什么?
- 如何用Excel制作heatmap(热图)
热门文章
- UC/OS-II内核调度分析
- 智慧养老:养老院人员定位系统+养老院病房对讲系统,实现一站式智能化养老院-新导智能
- 计算机职业学校在哪里,四川省托普计算机职业学校地址在哪里
- 深度学习 Day 4——利用RNN玩转股票预测
- 图吧助力座头鲸手机导航APP如虎添翼
- android 控制app声音,Android底层开发之APP音量单独控制
- DS90UB940 解串器芯片及驱动分析
- 华为鸿蒙os手机系统下载,华为鸿蒙2.0还原EMUI11系统
- java中trim()方法是用来干什么的?
- [论文笔记]弱监督条件下基于相似性条件学习的服饰搭配生成