当前位置:城玮文档网 >作文大全 > 概率统计统计--相关分析

概率统计统计--相关分析

时间:2022-08-10 09:45:05 来源:网友投稿

 补充教材:应用统计与计算(第一、二、七章)

 张弛

 编著

 电大科技大学出版社 教学目的 1、使学员掌握相关分析,一元、多元线性回归及曲线回归、因子分析等实用统计的基本概念、基本思想和计算方法,并能熟练应用它们解决教学、科研中的实际问题。

 2、使学员牢固掌握运用 SPSS 统计软件作统计分析的技能。

 第一章

 相关分析

 一、相关的意义 由变量相依关系的特点,变量之间的依存关系可分为两大类型:

 (1)确定性关系——函数关系,例如圆面积 S=πr 2 , y=e x + x2 等。

 (2)确定性关系——相关关系,例如人的血压 y 与年龄 x 之间的关系等。

 以往我们讨论过的许多数学学科,如分析几何、代数等都是研究变量之间确定性关系的,但非确定性关系在自然界和我们熟知的教育领域中大量存在,例如学习成绩与智力因素或与非智力因素之间,数学成绩与物理成绩之间,性别与学习成绩之间等,都存在某种相互联系,相互制约的依存关系,这种关系不是那种严格的函数关系,而是一种非确定性的关系。相关关系和函数关系也有联系:由于观察和测量中会产生误差,函数关系往往通过相关关系表现出来,变量间相关关系非常密切时,通常又呈现出某种函数关系趋势。

 二、相关的种类 按不同的分类标准,相关关系有多种分类 1、简单相关和复相关

 简单相关——两个变量之间的相关关系 按涉及变量的多少分

 复相关——一个变量与两个及以上个变量之间的相关关系 2、线性相关和非线性相关

 线性相关(直线相关) 按变量关系的表现形态,相关关系可分为

 非线性相关(曲线相关)

 3、正相关和负相关 按变量数值变化方向的总趋势,相关关系可分为正相关、负相关 正相关——两个变量变化方向的趋势相同(见教材 P 2 ,图 1-2 左) 负相关——两个变量变化方向的趋势相反(见教材 P 2 ,图 1-2 右) 4、完全相关、高度相关、低度相关和不相关 按两变量联系的紧密程度分,相关关系可分为完全相关、高度相关、低度相关和不相关(零相关)(解释见教材 P 2 -P 3 )。

 三、相关分析的主要内容 研究两个或两个以上变量之间是否存在相关关系,如果存在相关关系,其相关的性质和程度如何,这个过程在统计学上称为相关分析,相关分析的主要内容包括:

 1、确定变量之间有无相关关系存在,以及相关关系呈现的形态。

 2、确定相关关系的密切程度。断送相关关系密切程度的主要方法是绘制散点图和计算相关系数。

 3、对相关系数的显著性进行统计检验。

 §1.2

 积差相关系数及其显著性检验 一、积差相关系数(又称积矩相关系数),是 20 世纪初英国统计学家皮尔逊(K.Pearson)提出的一种计算两个变量线性相关的系数,通常用 r 或 r xy 表示,它实际上是考察的两个变量 y与 x 组成的二维随机向量(x、y)的样本相关系数。

 若对(x、y)作了 n 次观测,得到 n 对数据( x 1 ,y 1 )„„,( x n ,y n )。

 则定义 r 为:

              1 1121211,1) ( , ) ( ), )( (iiiinii yynii xxnii i xyyy xxxyyny xnx, y y L x x L y y x x :LL LLr其中

 由哥-席不等式易知 1 | |  r

 根据我们已具备的概率知识,当 1 | |  r

 时,可以认为 x 与 y 依 pr 为 1 存在完全的线

 性相关关系, | |r 越小, x 与 y 存在线性相关的程度越小,r=0 ,可以认为 x 与 y 不相关(不存在线性相关),但不相关并不等于 x 与 y 相互独立, x 与 y 之间可能存在其它形式的相关关系。在 | | r ≠0 时,r>0,可认为 x 与 y 正相关,r>0,可认为 x 与 y 负相关。

 二、积差相关系数的计算 当样本容量 n 不太大时,我们可用计算器计算积差相关系数,常用如下公式:

                 i iiii i yyi iiii i xxii ii iiii i i xyy n y yny Lx n x xnx Ly x n y x y xny x L22222222) (1) (1) )( (1 例 1 教本 P 4 -P 5

 计算 r xy 也可用统计软件 SPSS,今后在上机实习中练习。

 三、积差相关系数的显著性检验 设  表示 x 与 y 的总体相关系数,当  =0 时,称 x 与 y 不相关,利用样本相关系数 r可以检验 H 0 :  =0 当( x 、y)为二元正态变量时,可以证明 212rn rt

  ~

  t(n-2)

 (1.2-6) 利用该统计量检验 H 0 的拒绝域为 C={t | t |>t α }

 这里t 为 t(n-2)分布的分位数21t

 例 2

 (见教材 P 7 ) 例 3

 研究某校初三学生物理成绩 y 与数学成绩 x 之间的相关关系,随机抽取 10 名学生的数学、物理成绩如下:

 数学成绩ix

 94

  90

  86

  86

  72

  70

  68

  66

  65

  62 物理成绩iy

 93

  92

  92

  70

  82

  76

  65

  76

  68

  60 试求数学、物理成绩的积差相关系数,并检验它的显著性(  =0.05) 解:

     i iiii ix y x 58732 , 774 , 7582 H 0 真时

   i ii i iy x y 59686 , 612022 ∴40 . 1294 7741016120260 . 1275 758101587328 . 1016 774 7581015968622          yyxxxyLLL ∴ 7913 . 0 791305219 . 04 . 1294 6 . 12758 . 1016     r

 检验 H 0 :P xy =0 算出 306 . 2 8 66 . 3 | | 66 . 3122    )

 (t trn rt  

 ∴拒绝 H 0 ,认为物理成绩和数学成绩之间存在显著的线性相关。

 §1.3

 等级相关 积差相关系数一般适用于连续型总体,且总体分布服从或近似服从正态分布,故两个连续变量的观察数据必须成对出现,且不宜少于 30 对(根据中心根限定理,大样本时,可近似作取自正态总体),但在社会实践中,特别在教育和心理学方面的数据资料往往不能满足上述的条件,有些数据还是属性的测量(如测定品质的优劣、爱好程度、信念、态度等)常采用的等级评定。这时需要采用等级相关(rank correlation)的方法来研究变量之间的相关关系。

 一、等级相关是依据等级资料来研究变量间相关关系的相关量 等级资料包括:1、等级评定资料。2、经连续变量观测资料转化得到的等级资料。研究等级相关的相关量主要有斯皮尔曼(spearman)等级相关系数和肯德尔(kandall)和谐系数。

 等级相关不涉及变量的分布形态和数据量的多少,对于两个连续变量的观测资料,也可转化为等级资料计算等级相关系数。

 二、斯皮尔曼等级相关系数 斯皮尔曼等级相关系数是英国心理学家、统计学家 spearman 根据积差相关的概念推导出来的。其计算公式为:

 ) 1 (61212 n ndrNIiP 式中Pr —spearman 等级相关系数, d i —成对的第 i 对数据的等级差,n—总对数 例 1

 (教材 P8)

 例 2

 (教材 P9) 三、斯皮尔曼等级相关系数的显著性检验 1、若 n≥10,可用前述检验统计量(1.2-6)对 H 0 :L=0 作 t 检验。(例 见书 P10) 2、若 4≤n≤30 可查相关系数临界值表,对给定的显著水平 α ,当 |Pr |>r 时,否定H 0 认为 x 与 y 有显著的线性相关关系,当|Pr |≤r 时,不能拒绝 H 0 ,即认为 x 与 y 无显著的等级相关关系(查r 的自由度 df=n-2)。

 四、肯德尔和谐系数(补充内容) 1、概念及使用条件 肯德尔和谐系数(the kandall coefficient of concordace)是计算多个等级变量相关程度的一种相关量。前述的 spearman 等级相关讨论的是两个等级变量的相关程度,用于评价时只适用于两个评分者评价 N 个人或 N 件作品,或同一个人先后两次评价 N 个人或 N 件作品,而kandall 和谐系数则适用于数据资料是多列相关的等级资料,即可是 k 个评分者评(N)个对象,也可以是同一个人先后 k 次评 N 个对象。通过求得 kandall 和谐系数,可以较为客观地选择好的作品或好的评分者。

 2、公式与计算 以下用 W 表示肯德尔和谐系数 (1)同一评价者无相同等级评定时,W 的计算公式:

 ) (1213 2N N ksw

  (1.3-2)

 式中:N—被评的对象数;

 K—评分者人数或评分所依据的标准数; S—每个被评对象所评等级之和 R i 与所有这些和的平均数iR 的离差平方和,即        ninii iniiRnR R R S1 12212) (1) (

 当评分者意见完全一致时,S 取得最大值 ), (2132N N k  可见,和谐系数是实际求得的 S

 与其最大可能取值的比值,故 0≤W≤1。

 (2)同一评价者有相同等级评定时,W 的计算公式:

 ] ) ( [12113 2 kiiT K N N ksw

 (1.3-3)

 式中 K、N、S 的意义同(1.3-2)式, imiij ij in n T12 3) (

 这里 m i 为第 i 个评价者的评定结果中有重复等级的个数,n ij 为第 i 个评价者的评定结果中第j 个重复等级的相同等级数。

 对于评定结果无相同等级的评价者,T i =0,因此只须对评定结果有相同等级的评价者计算 T i 。

 例 3

 某校开展学生小论文比赛,请 6 位教师对入选的 6 篇论文评定得奖等级,结果如下表所示,试计算 6 位教师评定结果的 kandall 和谐系数。

  论文编号 评等 评分老师 一 二 三 四 五 六

 A 3 1 2 5 4 6

 B 2 1 3 4 5 6 C 3 2 1 5 4 6 D 4 1 2 6 3 5 E 3 1 2 6 4 5 F 4 2 1 5 3 6 R i

 19 8 11 31 23 34 126  iR R i 2

 361 64 121 961 529 1156 31922iR 解:由于每个评分老师对 6 篇论文的评定都无相同的等级,故用公式(1.3-2),由表中数据得:

 546 126613192 ) (612612612        i ii iR R S 87 . 0630546) 6 6 ( 6121546) (1213 2 3 2  N N ksw

 (由 W=0.87 表明 6 位老师的评定结果有较大的一致性) 例 4

 3 名专家对 6 篇心理学论文的评分经等级转换如下表所示,试计算专家评定结果的肯德尔和谐系数

 论文 等级 专家 A B C D E F  甲 1 4 2.5 5 6 2.5

 乙 2 3 1 5 6 4

 丙 1.5 3 1.5 4 5.5 5.5

 R i

 4.5 10 5 14 17.5 12 63 R i 2

 20.25 100 25 196 306.25 144 791.5 解:由于专家甲、丙对 6 篇论文有相同等级的评定,故用公式(1.3-3)计算 W:

 T 甲 =2 3 -2=6

  T 丙 =(2 3 -2)+(2 3 -2)=12 00 . 130 63615 . 791 ) (61612612      i iR R S 85 . 0 849673203 . 0153130)] 12 6 ( 3 ) 6 6 ( 3 [121130] ) ( [1213 2 3 2       iT k N N kSw 由 W=0.85 可看出专家评定结果有较大的一致性。

 五、肯德尔和谐系数的显著性检验 1、当评分者人数(k)在 3-20 之间,被评者(N)在 3-7 之间时,可查《肯德尔和谐系数(W)显著性临界值表》,检验 W 是否达到显著性水平。若实际计算的 S 值大于 k、N 相同的表内临界值S ,则 W 达到显著水平。

 例如例 3 中,K=6

 N=6,查表得检验水平分别为  =0.01,  =0.05 的临界值各为S 0.01 =282.4,S 0.05 =221.4,均小于实算的 S=546,故 W 达到显著水平,认为 6 位教师对 6 篇论文的评定相当一致。

 2、当被评者 n>7 时,则可用如下的2 统计量对 W 是否达到显著水平作检验。

 设 H 0 :评价者意见不一致 则:2 =k(N-1)W真0~H) 1 (2 N 

  (1.3-4) 对给定的水平  ,由 ) (212  P =  ,查 1   N df 的2 分布表得临界值为分位数 21 ,将计算出的 kandall 系数 W 等代入(1.3-4)式计算2 值 若 2 ) 1 (21N 则拒绝 H 0 , 认为评分者的意见显著一致。

 若 2 ) 1 (21N 则认为评分者的评判显著不一致。

 例如,在一次教学评价中,10 位评价者对 12 项指示进行评价,已计算出 W=0.65,需检验评价者的意见是否有显著的一致性(  =0.01)。

 将 k=10

  N=12

  W=0.65 代入(1.3-4)计算得 2 =10(12-1)×0.65=71.5 查表得20.99 (11)=24.73<2 =71.5 故认为 10 位评价者对 12 个指标的评价具有显著的一致性。

 §1.4

 其它相关系数及计算 一、点二列相关系数 在教育调查与研究中,常碰到只含两个类别的变量,例如性别,是否独生等,我们称这类变量为(二分)“称名”变量,如用 1,0 分别对应“二分称名变量”的两种类型,则对“二分称名变量”的一系列观测,得到一个“二分”数列。一个连续变量的一系列观测是一个点数列。如果一个点数列中的点与一个“二分”数列中的点存在一、一对应关系,则称这两个数列为点二列。点二列相关系数就是度量连续变量与“二分”称名变量之间相关程度的一个量。其计算公式为:

 pqsy yryq ppq

  (1.4-1)

 )

 式中各字母的意义见教本 P10 例 1 见书 P10—P11 点二列相关是积差相关的特殊应用,所以其显著性检验的方法与积差相关系数的显著性检验一样。

 二、二列相关系数 1、基本概念及计算 当两列变量都为正态分布的连续变量,而其中一列变量由于某种原因或按某种标准,被人为地分为两类别,变成一个二分变量(如及格与不及格,正确与错误,健康与不健康),表示这样两列变量之间相关程度的量,称为二列相关系数,其计算公式为:

 ypqsy yryq pb

  (1.4-2)

 )

 或中py 、qy ,yS q p , , 的意义同(1.4-1)式。求法是依据|p-0.5|的值,查《教育统计

 学》(扬宗义)附表 1,P 栏中该数值对应的 Y 值即是。

 例 2

 现有 120 人参加数学考试,其成绩为正态分布的连续变量,其中对某一选择题的回答,正确的 48 人,不正确的 72 人,结果如下表所示,该问题的得分与考试总分是否相关? 总分分组 人数 f i

 组中值x 1

 某一题回答 x 1 f 1

 正确(P) 错误(q) (P) (q) 90~100 80~90 70~80 60~70 50~60 40~50 30~40 20~30 10~20 2 5 14 29 31 23 10 4 2 95 85 75 65 55 45 35 25 15 2 5 9 16 8 6 2

  5 13 23 17 3 4 2 190 425 675 1040 440 270 70

  375 845 1265 765 280 100 30 

 120

 48 72 3110 3660 解:记 p 为回答正确的人数所占比例 则 P=12048=0.4

  q 为回答不正确的人数所占比例 则 q=1-0.4=0.6 79 . 64 ) 2 35 6 45 8 55 16 65 9 75 5 85 2 95 (481) (               pii ipnp f xy83 . 50) ( qii iqnq f xy

 16 . 242 4583290012014110001201) (1 12222 2       ii iii i yf xnf xnS

 ∴ 56 . 15yS

 由 P y =|P-0.5|=|0.4-0.5|=0.10,查表得知 0.09871<P y <0.10257,P 栏的 P 1 =0.09871 和P 2 =0.10257 的纵线高度 y 1 =0.38667,y 2 =0.38568 依线性插值公式:

 ) (11 21 21p pp py yy yy 

 得 3863 . 0 ) 09871 . 0 10 . 0 (09871 . 0 10257 . 038667 . 0 38568 . 038667 . 0    y

 将以上数据代入(1.4-2)式,得 5574 . 03863 . 06 . 0 4 . 056 . 1583 . 50 79 . 64 br

 2、r b 显著性检验

 检验 H。:r b 无显著意义 选用 )" 3 14 ( ) 1 , 0 ( ~0  Nnpqy rUHb真 当由观测数据算出 U 值满足|U|>21u (临界值)时,拒绝 H 0 ,认为 r b 有显著意义。

 本例中算出 U= 81478 . 41206 . 0 4 . 03863 . 0 5574 . 0 对  =0.05,由    ) U | (|2- 1U P

 查标准正态分布表得

 96 . 1 U2- 1

 ∵|U|>1.96,故不能接受 H 0 ,认为该选择题得分与考试总分有显著相关关系。

 三、偏相关系数 见教材 P12 *四

 、多系列相关 1、概念 多系列相关是二列相关的发展,它同样适用于两个正态变量的直线相关关系的衡量,但多系列相关处理的资料,一个变量为等距或比率变量,另一个变量为按一定的标准划分为三、四个或更多的类别的顺序变量。

 例如:学习成绩(等距离变量)与品德(分为四等的顺序变量)的相关,便是四系列相关。

 2、计算公式 贾斯明(Jaspen,1946)推导的多系列相关系数公式如下 ii Hi Li tii Hi LisP y y sX y yr/ ) () (2

  (1.4-4)

 式中 r s ——多系列相关系数; P i ——第 i 类别的频数比例; i X ——第 i 类相对应的连续变量 x 的观测值平均数。

 S t ——连续变量 x 全部观测值的标准差; y Hi 、y Hi 的意义:把正态曲线下的面积分为 k 部分,各部分的面积比分别为

 P 1 ,P 2 ,„„,P K ;y Li ,y Hi 分别表示面积为 P i 的部分之下、上限位置处正态曲线的高度(纵线)。

 例(见杨宗义主编《教育统计学》)P87 例 9

 略写 3、显著性检验 对 H 0 :r s 无显著意义 选用 ) 2 ( ~12 "02 " n trn rtHss真

  (1.4-5)

 其中sr是sr 的校正值kiiHi Lis spy yr r12]) ([ "

 对给定的水平  ,按 P   } | {| t t ,查表确定临界值,若由(1.4-5)算得的 t 值满足t t  | | 则不接受 H 0 。

 §1.5

 相关分析在教育测量中的应用 本节以相关分析在分析考试或测验试卷的质量上的应用说明相关分析在教育测量中的应用。

 评价一份试题合理性的质量指标主要有效度,信度、难度、区分度四项,其中效度、信度、区分度都不同程度地可用某种相关系数来衡量。

 一、效度 效度是指用一份试题测验能够测出其所要测量的结果的有效性指标。

 效度可以用测试结果(考分)与被测对象在该学科上真实水平的相关系数来度量,效度的取值在[-1,1]之间。

 效度有内容效度、效标关联效度之分。

 1、内容效度——反映试卷测试内容与所要测试目标的吻合程度,是评价试卷质量的基础,一般由有经验的专家,教师作定性分析。

 2、效标关联效度 设学生的效标测值(某次公认的标准测验的考分或几次测验的平均分)为 y 1 ,y 2 ,„„,y n ,需作评价的测试题考分为 x 1 ,

 x 2 ,„„ x n ,则 x 与 y 的积差相关系数 yy xxxyXYL LLr 

 作效率 r 的度量。一般地,效度 r 越高,说明测验成绩接受学生的实际水平,当 r≥0.45

 时,效度为适当。

 此外,若测验成绩与效标值几乎是同时获得,所求得的效度称为协同效度;若效标值是试题测验后一段时间才获得的,则所求的效度为 预测效度。例如高考模拟题的效度就属此类。

 二、信度 信度指测试结果的可靠或可信程度。信度不涉及测试是否正确反映评价目标,它所反映的只是测试结果是否稳定和一致。信度的最大值为 1,最小值为-1,一份好的试卷,要求信度达 0.90 以上。

 信度的测量方法很多,按测量方法的不同,可分为如下几类:

 1、再测信度——试卷在一定时间间隔内对同一对象群两次测试结果的相关系数。

 再测信度可较好地反映试卷的稳定性,但较易受两次测试时间间隔长、短的影响,且操作麻烦。

 2、“等价形式”程度——以“等价”的两份试卷同时施测于同一批对象群所得结果的相关系数。

 缺陷:拟一份与“评价试卷”等价的试卷不易做到,同时也加重被测对象的负担。

 3、分半信度:用试卷测试(一次)后,将其分为等值的两半(如分奇、偶数题等)分别计分,两半得分的相关系数 r 11 称分半信度,再以 S-B 公式效正为试卷信度,其公式如下:

 ) — (12111111分半信度 rrrr

 (1.5-1)

 例 1

 采用某试卷对 5 名学生(此处为计算简单计,实际中应大大超过这个人数)进行测试,结果如表 1-7,试估计试卷的信度。

 表 1-7 学生 序号 总分 第一大题 第二大题 三 四 奇(x i ) 偶(y i ) 1

  2

  3

  4 1

  2 1 2 3 4 5 90 78 82 63 42 5

  5

  5

  5 5

  5

  5

  5 5

  5

  5

  5 2

  5

  2

  4 3

  0

  0

 2 15

  12 12 13 14

  10 10

  10 8

  10 20 20 20 18 10 23 15 18 12 8 45 42 44 32 22 45 36 38 31 20 x

 s s 2

 71 16.95 287.2

 4

  4

  3.6

 3.8 1.26

 2

 1.74

 1.17 1.6

  4

 3.0

  1.4 11.8

 11 2.56 1.26 6.6

 1.6 17.6 3.88 15.0 15.2 5.11 26.2 37 8.81 77.6 34 8.32 69.2 这里第一大题共 4 个小题,每个小题满分为 5 分,第二大题共 2 个小题,第小题满分为15 分,第三题满分为 25 分,第四题满分为 25 分。

 解:将试卷按奇、偶分半后,算得 96 . 0111y xnii is nsy x n y xr

 由(1.5-1)得整个试卷信度为 98 . 096 . 0 196 . 0 2 r

 4、  系数信度 分半法求分半信度虽然较容易,但较难保证所分的两半真正“等价”,且分半信度受分法的影响使其有差异,于是库德——理查逊(Kuder-Richason)、克朗巴赫(cronbach)等人从另一角度考虑度量信度的方法 以2 ,2e ,2t 分别表示学生真实分数、误差和总分的方差,则应有2t =2 +2e

 显然真实分数的方差在总分方差中所占的比例越大,试卷的信度越高,故信度 r 用下式计算较合理:

 22tr 

  (1.5-2) 然而2 ,2e 都无从知道,只能用统计方法估计,克朗巴赫基于以上思想,提出如下的  系数信度公式:

 ) 1 (1212sskkkii  

 (1.5-3) 式中 k——测试题的题数

 2is ——第 i 题考分的方差

 s 2 ——测试总分的方差 (公式实际上是把各试题的方差之和作 2e ,1  kk为修正系数) 例 2

 利用  系数公式求例 1 中试卷的信度 解:见前面的表 1-7,可得         siis124 . 59 2 . 26 0 . 15 6 . 1 6 . 6 4 . 1 0 . 3 4 6 . 1

  s 2 =287.2,

 k=8 代 入 式(1.5-3)得:

 91 . 0 )2 . 2874 . 591 (78   

 与例 1 中用分半法求出的信度 0.96 相差不多。

 在实际中,试卷的信度通常用分半法和  系数法估计。

 三、难度 表示试题难易程度的数量指标叫 难度系数或 难度指数,本教材用 H 表示。

 计算 H 常根据试卷中具体的题目的测试结果计算。

 对非“二分”记分的题(主观题等)常用如下公式求其难度指数:

 jjjwxH  1

 (1.5-4)

 式中 H j 表第 j 题的难度指数

 w j ——第 j 题满分

 j x ——测试对象第 j 题平均分 对“二分法”计分的试题(如答对或答错两类答案的单选题、判断题等客观题),也可用下式求 H j :nNHjj   1 1受试总人数答对本题的人数

  (1.5-5)

 难度系数 H 越小,试题越易;H 越大,试题越难,难度指数越接近 0.5,其区别力越高,则该试题的难度是适宜的。

 例 3

 按式(1.5-4)的难度公式,计算例 1 中各小题的难度。

 解:例 1 中包括大题在内,共有 8 个题,据前面的表:

 2 . 15 , 6 . 17 , 11 , 8 . 11 , 8 . 3 , 6 . 3 , 48 7 6 5 4 3 2 1         x x x x x x x x25 , 15 , 58 7 6 5 4 3 2 1        W W W W W W W W

 代入式(1.5-4),分别算得:

 30 . 0 , 27 . 0 , 23 . 0 , 32 . 0 , 28 . 0 , 20 . 07 6 5 4 3 2 1       H H H H H H H39 . 08 H 。

 四、区分度 区分度是反映试题对于测试对象群实际水平区分能力的指标,一般试卷第 j 题的区分度djr 用该题得分与试卷总分的相关系数表示:

 ) 5 5 . 1 () (1) (1212 2121      yy j jjiiniiiijniijniji ijdjL x Lxy Lxyny xnxy x n y xr

 式中 X ij ——第 i 个考生第 j 题的得分

 y i ——第 i 个考生的测试总分 n——考生人数 例 4 按式(1.5-5)计算例 1 中各小题的区分度。

 解:以计算 r d1 为例,其余可以类似计算。

 X 11

  X 21

  X 31

 X 41

 X 51

 1 X

 S 1

 5

  5

  5

 2

  3

  4

  1.26 1y

  2y

 3y

 4y

 5y

 y

  S 90

 78

 82

 63

 42

 71

 16.95 51, 1502ii i yx

  代入式(1.5-5)得 77 . 095 . 16 26 . 1 571 4 5 15021   dr

 同法可得 r d2 =0.82

 r d3 =0.95

  r d4 =0.82

  r d5 =0.97

  r d6 =0.55

 r d7 =0.93

 r d8 =0.95 注:1、当样本容量 n 较小时,上式 r d 的计算受测试随机误差的影响较大,某题得分与试卷总分是否相关,还需进行相关性检验。

 注:2、试题的难度和区分度是两个不同的指标,但两者之间存在着一定的联系,通常太易或太难的题目,区分度是不高的,而难度适中的题,区分度一般较高。

相关热词搜索: 统计 概率 分析