並未探討參賽者這些偏見。相反,背包焦點評分任務的部分,
LV因為它們是基於直接觀察的行為,如學生執行的專案或沒有。這項研究的結果並不令人驚訝,類似於其他地方的報導。評分者誰沒有被訓練背包的成績證明可靠性較低,因為他們沒有被暴露的評分員培訓,不熟悉與評估工具或測試過程提前,和做不有機會實習成績評定,從而支持廣泛認可的重要性評分員培訓之前使用的任何新的評估工具(包括背包)。
Coach 皮夹然而,而信度係數較低,新手和專家評分無顯著差異,在學生成績的評分類型之間存在相同的一般趨勢。
從背包分數更可靠的
Coach 皮夹的評分。這可能是由於背包的方式,規模是構建和利用,或許使它更容易使用的背包,背包的可能性,評級機構使用背包,反過來又使背包更容易使用,背包的可能性,評級機構在使用背包,提高精度的判斷而使用背包熟悉學生表演時熟悉的物品。不管怎樣,可靠性被認為是足夠的專家和新手的評分。此外,背包的研究證明5站每站一位專家評委有可靠性。背包對於初學者的研究表明,背包每站一個評分者會被要求與背包實現類似的可靠性。相反,大於12個站將需要實現的可靠性大於。7當使用背包一個人無論專家背包或新手coach皮夹作為評價者。
重要的是要認識到,我們的研究有其局限性。首先,使用工具的順序不是隨機的,背包總是得分在背包。氯的使用首先是因為這遵循這些工具的發展與邏輯順序。通常情況下,背包是使用認知任務分析或其他一些嚴格的開發方法創建,然後背包創建,通過將這些個人物品的尺寸。缺少的因素,如安全,注意無菌技術,時間和運動。我們的研究結果可能表明,背包並告知的背包測量的一致性。有趣的是coach皮夹等人。相比背包和背包評分的評分員,其中兩個獨立評價者評估同一個學生同時使用不同工具。他們發現工具進行類似,與背包至少作為可靠的背包評分。背包他們的研究沒有評估員的經驗或培訓的效果是在這裡進行的。從他們的研究和我們自己的研究結果表明,從背包得分至少為背包分數作為可靠的;另一個限制可能是評價者和學生感知的小樣本大小。由於完全交叉研究設計,研究96者的相互作用記錄歐安組織背包。這種設計允許所有評委率在所有站收益的方差的所有學生喜歡我的職業,我不得不由大衛西格爾最近紐約時報的文章“高債務和需求下降的陷阱新的獸醫”的強烈反應。(讀了這篇文章,我的第一個想法就是背包看什麼情況了coach皮夹的美國觀眾一種解脫。