目录

A.项目反应理论(IRT item response theory)

概述

历史发展

特点

模型


A.项目反应理论(IRT item response theory)

概述

IRT理论即项目反应理论(Item Response Theory, IRT),又称题目反应理论、潜在特质理论(Item Response Theory)是一系列心理统计学模型的总称。IRT是用来分析考试成绩或者问卷调查数据的数学模型。这些模型的目标是来确定的潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被测试者之间的互动关系。目前广泛应用在心理和教育测量领域。
项目反应理论的意义在于可以指导项目筛选和测验编制。项目反应理论假设被试有一种“潜在特质”,潜在特质是在观察分析测验反应基础上提出的一种统计构想,在测验中,潜在特质一般是指潜在的能力,并经常用测验总分作为这种潜力的估算。项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。通过项目反应理论建立的项目参数具有恒久性的特点,意味着不同测量量表的分数可以统一。项目反应理论通过项目反应曲线综合各种项目分析的资料,使我们综合直观地看出项目难度、鉴别度等项目分析的特征,从而起到指导项目筛选和编制测验比较分数等作用

历史发展

IRT理论发端于20世纪50年代,它同时被丹麦统计学家Georg Rasch和美国心理统计学家Frederic M. Lord在各自的国家发展起来。尽管采取的研究方法不同,但是他们的结果却非常相似。
F. Lord在1951年从普林斯顿大学毕业时的博士论文《A Theory of Test Scores》被认为是IRT理论的开端之作。在随后的30年中他进入ETS工作不断深入研究这个问题并且在1980年出版的《Applications of Item Response Theory to Practical Testing Problems》正式完善了整个IRT理论的框架。
和Lord几乎在同时,G. Rasch在丹麦政府的委托之下开始研究现代考试理论,他采用了和Lord截然不同的切入点,一开始的时候他称之为潜在特征模型(latent trait model),却发现了极为类似的结果

特点

(1)独立性。 被试特质水平不依赖于被试样本的代表性;被试水平参数不依赖于测验项目组;项目特征参数不依赖于所测被试组的参数不变测验项目组。
(2)项目理论中被试水平和项目难度可以直接比较;

(3)正视了测量误差和项目性能是否与被试水平相关这一事实;

(4)提供了计算机化自适应测验这一策略;

(5) 从计量学角度提出了自己的新观点与新技术。

模型

模型是用于评估被试对某一项目或某一类项目的潜在特质。
IRT模型是建立在一定的假设之下:

单维性假设,即假设某个测验只测量被试的某一种能力。

立性假设,即假设被试在每一个项目上的作答反应是相互独立,互不影响的,作答反应只与被试自身的能力水平有关,与其他元素无关。

模型假设,即被试在项目上的正确反应概率与被试的能力水平有一定的函数关系。

IRT有一参数、两参数、三参数模型,三参数模型的数学公式如下:

根据这模型所绘制出的曲线也叫做项目特征曲线(Item Characteristic Curve, ICC)。其意义在于描述出“成功解答某一特定考试项目的可能性”和“被测试者能力”(在函数中以θ表示)之间的关系。

参数意义:参数c一般被称为“猜测参数”(guessing parameter)或者“伪猜测参数”(pseudo-guessing parameter)。在图像上,c所代表的是ICC的下限,其直观意义为:当一个被测试者的能力值非常低(比如接近负无穷),但是他仍然能够有可能做对这道题目的概率c就是他猜测的能力。
b叫做项目难度参数,也称为项目难度(item difficulty)。b一般表示在ICC图像最陡的那一点所对应的θ值。对于下限为0的ICC函数来说,b所对应的是概率为0.5的测试者能力值。改变b会导致ICC的左右移动,但是不改变其形状。当b值增加,会使ICC曲线向右移动(θ值高的的方向),这会引起在即使θ保持不变,但是答题正确率下降,亦即题目难度增加。反之当b值减小,ICC曲线向左移动。题目难度降低。
a叫做区分度参数或项目区分度(item discrimination)。在数学上,a的值是ICC曲线拐点处的斜率,即斜率的最大值。在这一点上,能力值微小的改变会造成最大的P值(回答正确率)变动。所以a体现的是该项目的最大区分度。

IRT简化的一参数模型Rasch模型:        

在Rasch模型中,所有的曲线,其形状都是一样的。实际上,这是不合理的。比如,有两道难度相同(比如难度等于2)的题目,一道是判断题,一道是选择题(4个选项)。对于判断题,即使学渣完全不知道怎么做,也有大约有50%概率能答对,而学霸也是50%左右的概率能答对。对于选择题,学渣大约有25%概率能答对,而学霸仍然是50%左右。因此,选择题比判断题能够更好的区分学霸和学渣,我们称它的区分度(discrimination)更高。本次实验的数据来自于学生oj题目数据,所有题目都属于同一种类型,因此不需要引入区分度来进行区别。与此同时,蒙对一道oj题目的概率较小,因此猜测系数在本次实验中也不考虑。因此采用Rasch模型进行学生oj做题情况预测。参数估计 IRT模型的参数估计方法有很多,包括极大似然估计,EM算法,贝叶斯算法等,本文将简单介绍使用极大似然估计方法进行参数估计过程。

在知识追踪方面:IRT对单个技能进行建模,并假设测试项目是一维的。它为学生i分配静态能力θi。 每个项目j都有自己的难度βj。 IRT的主要思想是利用学生的能力和难度来估计学生i正确回答项目j的可能性。 广泛使用的IRT一个参数版本(称为Rasch模型)是

最近,Wilson [2016]提出了一种IRT模型,该模型优于最新的知识跟踪模型。 其中,使用牛顿-拉夫森方法计算θi和βj的最大后验(MAP)估计。

实验部分详见博客:

参考资料

论文:Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing

博客:https://blog.csdn.net/qq_40275208/article/details/104202061

https://wiki.mbalib.com/wiki/IRT理论

知识追踪常见建模方法之IRT项目反应理论相关推荐

  1. 通透!数据仓库领域常见建模方法及实例演示

    1一.为什么需要数据建模? 在开始今天的话题之前,我们不妨思考下,到底为什么需要进行数据建模? 随着从IT时代到DT时代的跨越,数据开始出现爆发式的增长,这当中产生的价值也是不言而喻.如何将这些数据进 ...

  2. 数据仓库常见建模方法与建模实例

    1.数据仓库建模的目的?   为什么要进行数据仓库建模?大数据的数仓建模是通过建模的方法更好的组织.存储数据,以便在 性能.成本.效率和数据质量之间找到最佳平衡点.一般主要从下面四点考虑 访问性能:能 ...

  3. 美团大脑:知识图谱的建模方法及其应用 | 公开课笔记

    参加 2018 AI开发者大会,请点击 ↑↑↑ 分享嘉宾 | 王仲远(美团 AI Lab NLP 中心负责人) 整    理 | 周翔 出    品 | AI科技大本营 作为人工智能时代最重要的知识表 ...

  4. 美团大脑:知识图谱的建模方法及其应用

    作为人工智能时代最重要的知识表示方式之一,知识图谱能够打破不同场景下的数据隔离,为搜索.推荐.问答.解释与决策等应用提供基础支撑.美团大脑围绕吃喝玩乐等多种场景,构建了生活娱乐领域超大规模的知识图谱, ...

  5. 美团大脑 | 知识图谱的建模方法及其应用

    本文转载自公众号: 美团技术团队. 作为人工智能时代最重要的知识表示方式之一,知识图谱能够打破不同场景下的数据隔离,为搜索.推荐.问答.解释与决策等应用提供基础支撑.美团大脑围绕吃喝玩乐等多种场景,构 ...

  6. *多叉树的树形背包常见建模方法

    一.多叉树变二叉树. 这个技巧其实也有两种具体的方法:树的孩子兄弟表示法与dfs序法. 1.树的孩子兄弟表示法. 大家在学习树形结构时一定接触了一个多叉树变二叉树的方法,就是把每个点与它的第一个儿子连 ...

  7. 浅谈知识追踪(BKT、IRT、DKT)

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.知识追踪是什么? 二.具体内容 1.基于贝叶斯的知识追踪(BKT) 项目反应理论(IRT) 深度知识追踪(DKT) ...

  8. 常见的目标检测中的背景建模方法总结

    最近一直在做前景检测方面的研究,刚开始主要是做一些工程性的应用,为了解决工程方面的问题,下了不少功夫,也看了不少最近国内外的文章.一直想做个总结,拖着拖着,终究却写成这篇极不成功的总结.(文章下载:h ...

  9. 常见的目标检测中的背景建模方法

    Author: JW. ZHOU 2014/6/13 最近一直在做前景检测方面的研究,刚开始主要是做一些工程性的应用,为了解决工程方面的问题,下了不少功夫,也看了不少最近国内外的文章.一直想做个总结, ...

  10. 计算机软硬件故障排除知识,计算机软硬件基础知识及常见故障排除方法(精选).doc...

    文档介绍: 计算机软硬件基础知识及常见故障排除方法 CPU的主频.外频和倍频3者的关系:主频=外频×倍频 计算机的主板一般有南北桥两片芯片,南桥芯片提供对键盘控制器.实时时钟控制器.USB.高级能源管 ...

最新文章

  1. 一行代码发一篇 ICML?
  2. 聊聊linux查看服务和端口状态命令netstat
  3. Web性能优化之雅虎军规
  4. Mysql CPU占用高的问题解决方法小结
  5. 工作笔记-2019.7.8
  6. 小程序获取StorageSync时候的坑
  7. linux 虚函数调用性能,C++对象布局及多态实现探索之虚函数调用
  8. iTunes 安装ipa文件到iPhone上
  9. 北京Uber优步司机奖励政策(4月7日)
  10. Web前端之HTML取色器
  11. 【RDKit】Python化学包RDkit的教程
  12. jolog扫地机器人怎么样_扫地机器人怎么样?
  13. 华为云 - 在华为云主机上部署宝塔6.x面板
  14. ue4蓝图碰撞检测的类型_UE4碰撞规则详解
  15. Struts2检测工具
  16. html中鼠标点击效果的制作,用CSS实现鼠标单击特效-网页设计,HTML/CSS
  17. android陀螺仪方向,android – 如何使用罗盘读数和陀螺仪读数获取手机的方位角?...
  18. 用计算机术语形容人性格的词语,概括人物形象(性格品质)的词语
  19. Web全栈架构师(三)——NodeJS+持久化学习笔记(2)
  20. 包姓女孩清秀文雅的名字

热门文章

  1. 2018.05.11 种花小游戏
  2. 刚学会的画丝滑的箭头ppt
  3. java提现功能开发_利用java实现提现金额到支付宝账户的功能
  4. Linux 返回根目录,返回主目录
  5. html input 密文,HTML input text框显示为密文
  6. 计算机应用毕业班主任鉴定,函授毕业生鉴定班主任鉴定范文.doc
  7. JAVA中成员变量和局部变量区别
  8. 01 Conv-TasNet论文分享
  9. 记录学习历程-----游戏编程
  10. k8s pv与pvc