昨晚翻阅到一篇有意思的文章,Sci-hub对论文引用的影响,这篇文章于2020年在在arXiv预印本平台上就已经发表,2022年正式刊发在Scientometrics的第1期中。

一、 Sci-Hub新版提供了网站下载日志,中国下载居于榜首
Sci-Hub 创始人 Alexandra Elbakyan 在今年情人节发了一条推特:「 Sci-Hub 更新了,现在用户可以实时查看下载统计、每月统计等,并在将来会增加更多内容。」新版中,用户可以查看上个月通过SCI-HUB下载论文最多的国家/地区(使用vpn、镜像代理等数据会过滤掉)链接:https://sci-hub.se/stats。

(1)目前,中国大陆在 Sci-Hub 上的论文下载数量排名全球第一,超过三千万次下载(31,789,284),遥遥领先,几乎是排名第二的美国的三倍(11,184,904)。而在2022.2.12日公布的前30天的访问量,中国高达3亿次。

(2)Alexandra Elbakyan评价说:“美国一直声称美国大学的科研机构已经购买了文章的版权,因此没有人使用Sci-hub网站,但其实事实并非如此。”数据不会骗人,富有如美国科研机构,对于科研文章资源的购买率也很难达到100%,这份统计数据更加证明了Sci-hub网站在全球范围内都发挥着重要的作用。

(3)巴西居然排第 4,尽管(巴西的)许多研究人员与一些私立教授都有政府授权的多个期刊访问期限。看来Sci-Hub 覆盖了更多期刊内容、且访问更容易。

(4)英国在首次公布排名中,未在前20,而本次数据显示位列19,这似乎不符合英国科研强国的地位,根据Alexandra Elbakyan 本人解释,是因为「Sci-Hub 在英国是被封禁的,用户需要使用 VPN 才能访问,所以有时候可能会以『美国用户』的身份出现在 Sci-Hub 上。」根据nature的报道(doi:10.1038/d41586-022-00556-y),印度正在进行的法律斗争可能会影响该国研究人员的使用。

二、 新版logo的变化,象征着知识自由
新版本 Sci-Hub 的 logo 从小乌鸦衔着的钥匙环变成了「锤子和镰刀」,作者在她的简介和工作理念提到了两个重要理念:communism(共产主义)和information god(信息神)。她的政治观点是共产主义,她认为:知识属于所有人。(社会学家罗伯特·默顿(Robert Merton)将共产主义确定为科学中的基本伦理价值观之一。苏联,第一个共产主义国家,是以科学为基础的。当知识只为富人提供而科学家被剥削时,当前科学的失败是资本主义的结果。)是否意味着这场知识产权之争可能会演变为科研话语权之争,甚至演变为政治之争?

在2021年Sci-hub曾面临了一次较长时间的停更最新数据,nature也报道指出在多个国家科研人员的诉求和支持下,网站再次恢复了文章获取的功能,但是合理推测,类似这样的争议可能会长期存在,免费文献的获取可能也会面临新的困难,科研人员们对于开放科学资源共享的斗争,任重而道远。

三、 Sci-hub数据量到底有多少?
Sci-Hub 正在满足世界许多地方的需求,在受到各大数据库商围剿的同时,也受到全球科研学者的鼎力支持。2013 年Sci-Hub 的研究论文数约为 2,300 万, 2021 年研究论文增长至88,343,822 份。

(1)当前数据库大约为 100TB;

(2)Sci-Hub 对所有主要科学出版商文章的覆盖率均超过 95%;

(3)77% 的文档发表在 1980 至 2020 年期间,36% 发表在 2010 至 2020 期间;

(4)大约 80% 是发表在学术期刊上的研究文章、6% 是发表在学术会议上的论文、5% 是书籍章节内容,其余是其他类型的文档;

(5)就学科而言,占比最多的学科是医学,大约有 2,500 万,来自医疗与健康期刊。紧接着是化学、生物学、人类与社会学等。


四、 Sci-hub下载的论文与不能下载论文被引差距?
Sci-Hub 提供了Sci-hub的下载日志,用户可以通过官网下载2011-2013、2017年至今下载数据,John Bohannon利用2015.09-2016.02月分析数据在科学计量学杂志“scientometrics”上发表了文章,表明从 Sci-Hub 下载的文章被引用次数是未从 Sci-Hub 下载的论文的 1.72 倍。

数据集:
研究人员为此准备了两个数据集,其中包含Nature、Science在内的12种顶级期刊上发表的文章信息,横跨神经科学、经济学等多个领域。
第一个数据集包含2015年9月至2016年2月这段时间内,能从Sci-hub上下载到的所有文章。
第二个数据集则来自传统的Scopus数据库,包含同一时段内,在选定期刊上发表的所有文章。
并且,通过跟第一个数据集的对照,研究人员筛掉了其中能在Sci-hub上下载的文章,使其仅包括无法通过Sci-hub免费获取的论文。
对于每一篇论文,研究人员都统计了其中图表的数量。另外,还统计了每篇论文第一作者和通讯作者的H-index、每本期刊的影响因子,以及每个作者所属国家的研究资源等数据。

研究结果
研究人员通过最小二乘法、离群值影响、带有工具变量的稳健回归、异方差校正等等一系列广义加成模型来评估关系的敏感性。
在控制了所有的偏差来源之后,结果显示,能从Sci-hub下载的论文的被引次数,是不能从Sci-hub下载的论文的1.72倍(p<0.001)。

分析:
研究人员认为,这样的Sci-hub效应具有多重意义。
第一,除了作为一个面对全球开放存取的「线上图书馆」,Sci-hub的下载量也可以作为一个重要的参考数据,用以预测论文未来的引用量。
第二,Sci-hub效应的存在,表明论文的版权限制,很可能会阻碍科研人员的工作。
在过去的几十年里,不仅通过像Sci-hub这样的途径「盗版」的科学论文越来越多,arXiv这样的开放预印本论文平台也越来越受到科研人员的认可。
不过,矛盾的是,Sci-hub的存在也可能反过来维护了当前的出版系统——当人们有途径能获取免费论文时,对封闭出版系统带来的限制感知就没有那么强烈了。

文章原载于“中外核心期刊”
参考文献:
[1]Sci-Hub统计数据.https://sci-hub.se/stats
[2]Sci-Hub 对论文引用的影响. https://link.springer.com/article/10.1007/s11192-020-03806-w
[3]机器之心.近30天中国下载第一,Sci-Hub新年首更,实时查看下载统计.https://m.thepaper.cn/baijiahao_16681109
[4]Sci-Hub downloads show countries where pirate paper site is most used.https://www.nature.com/articles/d41586-022-00556-y

Sci-hub效应:被引提升1.72倍?最近30天下载最多的国家是?相关推荐

  1. 如何使用sci.hub下载文献

    第一步广泛搜索文献 谷歌学术镜像地址 下图的现在访问随便点击一个进去 分别输入关键词,然后点击左侧自定义筛选条件,然后回车或者点击搜索 文章右侧带有[PDF] arxiv.org字样的一般都是点进去直 ...

  2. sci hub论文下载方法及脚本插件安装

    下载安装Tampermonkey 首先打开浏览器下载油猴脚本:Tampermonkey下载 如图点击黑色的下载 由于我安装过所以显示已安装,之后按照指示一直点下一步即可 最终安装完Tampermonk ...

  3. 零一裂变合作商:零售行业如何做分销活动,让总营收提升3.3倍?

    相信很多做零售的朋友都能体会到这一点:在疫情影响.线下流量增长停滞不前.电商迅速发展等等多个因素影响下,客流日趋减少,获客难成为线下零售的普遍痛点. 在这个背景下,如果说有一家线下商超,在活动让利不到 ...

  4. 面试官:我想用Nginx提升系统10倍性能,你有哪些建议?

    提升Web应用的性能从未像今天这样刻不容缓. 在线经济活动的比例日益提高,就连发展中国家和地区的经济活动都已经有5%以上在线进行了(相关数据请参考本文后面的资源).在这个超级链接.随时在线的现代世界, ...

  5. 4 次版本迭代,我们将项目性能提升了 360 倍!

    一直不知道性能优化都要做些什么,从哪方面思考,直到最近接手了一个公司的小项目,可谓麻雀虽小五脏俱全.让我这个编程小白学到了很多性能优化的知识,或者说一些思考方式.真的感受到任何一点效率的损失放大一定倍 ...

  6. 咕咚技术总监唐平麟:神策使我们的数据平台成本降低约 75%,迭代效率提升 2~3 倍...

    在这个数据爆炸的时代,数据成为各行各业出奇制胜的法宝,运动行业也不例外,那么大数据对运动业有什么价值呢? 咕咚作为智能运动的倡导者和先行者,致力于成为全球领先的运动大数据和服务平台,现已为超过 1.5 ...

  7. 习题7-2 求一批整数中出现最多的个位数字 (20分)

    习题7-2 求一批整数中出现最多的个位数字 (20分) 给定一批整数,分析每个整数的每一位数字,求出现次数最多的个位数字.例如给定3个整数1234.2345.3456,其中出现最多次数的数字是3和4, ...

  8. h5 神策埋点_咕咚技术总监唐平麟:神策使我们的数据平台成本降低约 75%,迭代效率提升 2~3 倍...

    在这个数据爆炸的时代,数据成为各行各业出奇制胜的法宝,运动行业也不例外,那么大数据对运动业有什么价值呢? 咕咚作为智能运动的倡导者和先行者,致力于成为全球领先的运动大数据和服务平台,现已为超过 1.5 ...

  9. excel android 公式,两个超实用的Excel万能公式,瞬间提升你10倍工作效率!

    相信大家在平时的工作中,都会经常有用到公式的需要,但是下面这些公式你用过吗,今天小编就带大家一起看看吧! 1. SUM函数 这个函数不仅在我们学习的过程中会用到,即便到了工作后,也经常需要对各种数据进 ...

最新文章

  1. vue 保留两位小数 不能直接用toFixed(2) ?
  2. 皮一皮:秀恩爱死的快啊!!!!
  3. Objective-C:浅复制(拷贝)
  4. Mac OS X下安装nvm的方法
  5. python查看库函数和方法_查看python库函数和三方库函数文档
  6. 安徽破获以虚拟数字货币增值为幌子网络传销案,涉案逾2亿元
  7. feign调用https接口_SpringBoot 2.0 开发案例之整合HTTP客户端Feign
  8. 2019最新java实战项目资料
  9. RPA - 前置机虚拟化U盾识别方案
  10. Java获取本机外网ip地址的方法
  11. Kata Containers用例
  12. 程序员PK律师——瑞幸咖啡战局
  13. uniapp如何引入全局js
  14. 牛客多校第十场 Han Xin and His Troops(扩展中国剩余)
  15. 浅析U.2接口NVMe SSD双端口模式(上)——应用模式与设计实现
  16. uni-app触发点击事件
  17. 计算机系统时间的修复,电脑时间总是不对,小编教你如何恢复正常
  18. Python 二维数据
  19. Netty游戏服务器实战开发(12):线程任务组件开发
  20. PLC脆弱性评估及相应解决方案

热门文章

  1. 【软件工程】实验作业,期末大作业各种资源合集(传送门)
  2. unity应用开发实战案例_Unity3D游戏引擎开发实战从入门到精通
  3. 女生选择什么专业好?
  4. Nginx转发内网端口
  5. Putty,PuttyCM,WinSCP组合拳
  6. Android Okhttp3 unable to load android socket classes
  7. 365天英语口语学习_17,打错电话
  8. 【IT小知识】扩容是什么意思?扩容的近义词有哪些?
  9. 成都市等市、州 2015年《工程量清单计价定额》 人工费调整的批复〔2018〕8号
  10. java枚举类与成员变量的关系_深入理解枚举类