信号检测论在R中的计算
信号检测论在R中计算
信号检测理论导读:测量与计算
https://www.douban.com/note/784162736/
信号检测理论(Signal Detection Theory, SDT)在心理学中提供了一种用于测量区分(discriminate)两种刺激(stimuli)能力的方法。在实验中,其中一种刺激被看作信号(signal),而另一种被看作是噪声(noise)[注:信号和噪声并不等同于脉冲信号或白噪音,他们只是两个标签,代表刺激物是否与实验设置的目标相符]。信号检测理论的测量在不同实验范式中稍有差别。下面主要讲三种范式,即yes/no(是/否)范式,rating(评分)范式,和forced-choice(迫选)范式。
- Yes/no 范式
在yes/no范式中,有一些试验次(trial)是包含信号,而另一些试验次则包含噪声。例如,如果我们要测试听觉对纯音信号的区分力,那么一些试验次中包含一个纯音信号,而另一些是白噪音。而在另一些记忆任务中,信号可能被定义为旧信息,而噪声被定义为新信息。
信号检测理论认为,被试通过一个内在的决策变量(decision variable)来决定给出何种反应:如果决策变量的值足够高于决策标尺(criterion),那么被试就会给出yes反应,反之则给出no反应[注:决策变量是一个方便的假设,它在认知上或许与感知的范畴性有关,而神经机制上或许与神经元放电的强度有关]。在信号试验次中给出的yes反应被定义为击中(hit),而在噪声试验次中给出的yes反应被称为假警报(false-alarm)。决策变量在所有的信号试验次中的分布称为信号分布(signal distribution),而其在所有噪音试验次中的分布称为噪声分布(noise distribution)。一般我们假设这两个分布都是正态的,只在均值上有差异。
如上图所示,两个分布之间的均值差异被称为敏感度(sensitivity),用“d-prime”表示[注:d-prime一般写作d加一个无钩的apostrophe,这个概念类似统计学中的Cohen’s d,他们都表示两个同型分布之间的峰值间距]。决策尺度(Criterion, c)则刻画了被试是否对yes或no反应存在偏见(bias),如上图中,决策尺度并非出于两个分布的正中心[注:不是最优尺度,参见optimal observer theory],而是左偏的,这意味着被试更容易把噪声误认为是信号,而不是把信号更容易当作噪音。与决策尺度类似的,在c处的信号可能性(signal likelihood)和噪音可能性(noise likelihood)之间的比值,同样可以说明尺度是左偏还是右偏。若P(signal)>P(noise), P(signal)/P(noise)>1时,右偏,c>0。反之,左偏,c<0,如上图所示。
值得注意的是,d-prime法测量区分敏感度是基于两个假设:(1)信号分布和噪声分布都是正态分布,且(2)两个分布具有相等的标准差。这两个假设或许不成立,因而研究者也是用非参数估计量A-prime来估计敏感度[注:A-prime常写作A加上一个无钩的右上撇,本质上是对ROC曲线下面积的非参数估计,而d-prime则是在z转换后的ROC直线到z空间中心的垂直距离。因而事实上d是在ROC中的线段距离,而A是ROC的面积,两者并不是简单的参数和非参数对应物,参见其它材料]。
关于反应的偏见(bias),可以用beta或者c来做参数估计。其中beta(也写作希腊字母)即P(Singal)/P(noise),见上文。而c是criterion,见上文。beta亦常做对数变换,即ln(beta)。beta的非参数对应测量称为B-prime-prime(大写B加上两个无钩的右撇)。
- Rating范式
评分范式类似yes/no范式,每个试验次只呈现一个刺激。但是在评分范式中,每次的反应并不是两分的是或否,而是一个分级的反应,如1(非常不确定)到7(非常确定)[注:常常可以使用类似Likert尺度]。在评分范式中,有n个反应选项就会产生n-1个ROC曲线上的点,这些点可以用于估计ROC面积。Rating范式下的ROC面积估计称为Az,其中z表示z空间,而A表示面积,类似yes/no范式中的A-prime[注:不同于A-prime,Az并非完全的非参数估计,但它不对决策变量的标准差作假设]。同时,rating范式也可以计算d-prime,并通过d-prime来估算ROC Area,这种估算量被称为 A_d-prime,仍然是一种参数估计。我们须记得,只有A-prime才是真正的非参数估计。
- 迫选(forced-choice)范式
在迫选任务中,每个试验次呈现多个刺激,如m个刺激的迫选任务被称为“m择迫选任务” (m-alternative forced-choice, mAFC task)。在迫选任务中我们一般不考虑决策尺度,而常常测量敏感度。
测量值的计算
信号检测理论的测量值计算主要依靠两个函数,分别是正态分布累计密度函数(Phi function, i.e., cumulative distribution function, CDF)及其逆运算Phi^(-1)。Phi函数可以将比率转换为z值(单尾),而Phi^(-1)函数将z值转换为比率。
关于值为1或0的击中和假警报的处理
密度函数要求比率不能等于1或者0,不然其z转换就对应于正负无穷大。在这里介绍四种处理方法。
I. 放弃参数估计,使用非参数估计,如A-prime。
II. 合并不同被试的数据,以实现不存在1或0的比率情况。
III. loglinear法,给击中和假警报各加上0.5,总次数加上1。
IV. 最后,用0.5/n替换0,用(n-0.5)/n替换1。
How To Compute Signal Detection Theory Functions in JASP- A Case Study
For all these equations, z() represents the inverse of the cumulative distribution function of the normal (i.e., Gaussian) distribution. The inverse of the cumulative distribution function is also known as the quantile function. As we will see later, the quantile function for the normal distribution is called qnorm() in R. The case study that follows will put these into context, and will illustrate how to compute each one in JASP.