題:
美國評分系統:為什麼要使用離散評分?
Martin Van der Linden
2018-09-19 22:02:07 UTC
view on stackexchange narkive permalink

背景

在美國,許多大學都採用A–F評分方案,上面加上正負。

教授將A分配給F級的方式有所不同,但是我的感覺最依賴離散的“垃圾箱”。例如,有些教授使用相對評分,並(大致)將A授予前三​​等或班級,B授予後三等,等等。另一些教授則將A授予成績介於100%和95%之間的學生,對於94%到90%的學生來說是A−,對於86%到89%的學生來說是A +,等等。

使用離散垃圾箱必然意味著在某些情況下,學生正好位於與下一個垃圾箱接壤,那麼那個學生跳入下一個垃圾箱並將字母等級提高一個“等級”將花費很少。

如果(如果我猜)信中只有榮譽頭銜,而重要的是實際的基礎百分比等級。但是,在大多數地方(即,我所知道的所有地方),是學生成績的字母等級,而不是百分比等級本身。

這可能是一個問題,而實際上應該表明幾乎完美

通過不同的課程取平均值併計算一個人的GPA,事情變得更糟,這是可以理解的。

由於大多數大學都採用以下方案,所以情況變得更糟:

  • A:4.00
  • A-:3.67
  • B +:3.33
  • B:3.00
  • B-:2.67
  • C +:2.33
  • ...

同樣,這意味著從A−跳升到A所需要的學生的一半將對該學生的GPA產生重大影響,實際上,獲得一半以上的百分比的影響應該忽略不計,不管基準百分比是從什麼開始的。

在一個如此重視GPA的世界中,這意味著一半的百分比可以對學生的生活和職業產生重大影響。再次,這可能會使差一點就畢業的學生產生可以理解的挫敗感。

我的問題

我知道有些“姑息藥”可以處理離散的評分標準,避免其中的一些刀口情況,例如小數點後四捨五入。公平地說,我不認為這些是真正的解決方案(將小數點四捨五入只會將問題從一個閾值移到另一個閾值),但這不是我在這裡感興趣的。

我想知道的是:

  • 是否有任何論點支持使用像上面那樣的離散分級方案?
  • 還是僅僅是以下產品的產物?

換句話說,是否有人聲稱離散量表具有其自身的優點,而不是使用它的事實?在如此之多的地方(建立可比性),很難同時協調所有這些地方的變更?

好吧,我會質疑“對GPA的重視”,但我離題了。我一直認為它是“成績單應該反映出91確實比91有意義得多”嗎?基本上,它反映了一個事實,即GPA並沒有過分高估其準確性,因此不太敏感。正如您指出的那樣,邊緣案例是這種情況的不幸副產品。
此外,該系統並非美國獨有(加拿大也是如此)...您可以詢問離散的比例,而不僅僅是詢問美國
*該學生的學業成績將永遠顯示該課程“非常好,但不是完美”,而實際上應該表示“幾乎完美”。
A-的意思是“幾乎完美”是特殊的。如果我說某人在一堂課中獲得91.273%的成績,難道這不是更加強調“非常好但不是很完美”嗎?
至少要區分“通過”和“失敗”,必須使用離散量表
您要保留多少個有效數字?除非它是無限的,否則仍然會有離散數量的容器,其中許多並不是特別有用。
@Vladhagen-幾年前,我在物理課上的平均成績約為30%。那是可靠的A。成績而不是原始數字不好的另一個原因是...
-1
英國大學在四個級別上授予本科學位:第一,高等第二(又名2.1或兩個一),低等第二(又名2.2或兩個二),第三。父親被告知他在大學中最高2.1(可能在他的科目中)。他會*非常*寧願擁有最低的第一!(我相信他們最近也記錄了實際的標記。)
@MartinBonner-實際上完全可以預期,這是我整個課程的平均水平。教授沒想到學生會完全解決任何問題,儘管我偶爾會這樣做。關鍵是要看一個人能走多遠。所有等級都是可以歸一化的,因此更希望使用數量有限的離散等級,除非有某些有關如何對它們進行歸一化的國家法律。
諸如論文,研究論文,雕塑等之類的數字等級只是胡說八道。至少,您需要將數字分數限制為可以客觀評分的主題,即使如此,仍然存在很多偏差。
這是我在教學計劃中評估過的一堂課的[相關作業](https://unfamiliarplace.com/wp-content/uploads/2018/09/Grading-scales-and-degrees-of-fineness.pdf)。不太詳細,但希望在那裡有用。N.B.這門課程沒有發揮出我最好的成績。:p
十三 答案:
Vladhagen
2018-09-19 22:32:59 UTC
view on stackexchange narkive permalink

我贊成使用美國離散等級制度。我將要解決的一些想法如下:

正如OP所提到的,在美國,ABC等級系統是相對標準化的,並且被許多機構很好地理解。它使來自不同學校的學生之間的比較更加兼容(儘管是的,並不是完全可比的)。

除此之外,我認為ABC系統提供了適當數量的粒度。畢竟,您必須在某處截斷成績百分比。從某種意義上說,每個系統都是離散的。

在美國的數學班上,我為我的學生使用的一種方法是根據成績截止值建立聚類系統。百分比是保證。之後,我將學生分為幾組,幾乎沒有錯過截止時間的學生通常仍會適應。例如,假設我們有以下百分比:

93.23%,93.17%,92.88%,92.81%,92.08%

我會給出在正常情況下,前四個學生A為最後一個學生A-。 (通常比這更細微)。我覺得我給學生的成績通常非常準確地描述了他們相對於所陳述課程結果的熟練程度。當我還是一個學生的時候,情況也是如此。實際上,有時候我更希望獲得A級成績而不是原始成績。 “ A”聽起來比“我的原始程度達83%,但我是該課程中第二高的成績”好得多。

在我看來,ABC系統實際上要比更強系統要比原始百分比系統好。 Haskin博士的微積分I課程的95%比Bodrel博士的微積分I課程的97%好嗎?兩者都將獲得A級成績。還是我將微積分的97%和花藝設計的97%相比較?通過使用ABC系統,我們有效地對成績運行了一種“低通”濾波器。我認為這實際上可以使學生之間進行更公平的比較。

讓我還補充一點,從講師的角度來看,擁有原始百分比系統將糟糕。學生已經為自己的成績而苦惱。現在想像一下他們是否必須為獲得A而不是獲得100%而苦惱。您最終將使課程中有98%的學生擔心獲得99%的課程。只是變得太過分了。作為我自己的前學生,我實際上討厭原始系統。我很高興能夠獲得全班94%的A而不必擔心將其提高到95%。

我最後要說的是學校和成績並不總是公平的。這就是生活。無論使用哪種系統,從一個角度或另一個角度來看都將存在弊端。沒有完美的系統。


附錄:一些評論提到了相對於他人進行評分的想法。首先請注意,我提出的方法永遠不會使學生下降一個成績,而只會將其提高。有幾條評論似乎忽略了這一點。

@BartoszKP:“您的評分不是'他們相對於既定結果的熟練程度',而是'他們相對於既定結果和其他學生的熟練程度。”其他學生表現良好嗎?

提高分數怎麼表明學生“少知道”?看來,提高學分實際上表明學生了解更多

我想我可以只根據他們的原始分數來給學生評分,該死的百分之一十分。這樣,學生的評分就不會比同齡人相關。但是,這種“四捨五入零容忍”系統不是ABC系統的命名缺陷之一嗎?似乎我們正在嘗試在此演奏長笛的兩端。我可以看到,如果我將學生四捨五入,那顯然是不公平的。不過,我必須說,我從來沒有一個學生抱怨當我將他們的分數略微提高時,他們被評為“相對”。

第二,要繼續相對於同齡人進行評分的想法,我們需要記住,幾乎不可能為當前學期的學生提供相同考試經驗作為前幾個學期的學生。通過在一個學期內調整分數,這可以幫助控制每個學期之間考試難度的細微變化。請注意,我並不總是完全控制考試,因為考試通常必須與其他教授一起寫在團隊中。總而言之,哪個系統似乎更“公平”,一個根本無法控制考試寫作風格差異的系統或一個試圖解決這一問題的系統?

評論不作進一步討論;此對話已[移至聊天](https://chat.stackexchange.com/rooms/83475/discussion-on-answer-by-vladhagen-u-s-grading-system-why-discrete-grades)。如果您想提出一種對比立場,請對此問題或其他問題(酌情)寫一個明確的答案。在發布其他評論之前,請閱讀[this FAQ](https://academia.meta.stackexchange.com/q/4230/7734)。
我真的很感激其中包含“我以前是學生……”的任何東西:)
Dan Romik
2018-09-19 22:51:29 UTC
view on stackexchange narkive permalink

這會給“幾乎做到了”的學生帶來可理解的挫敗感。

值得記住的是,生活結果也是離散的,並且這也會給學生(以及其他所有人)帶來類似的挫敗感:您要么獲得了獎學金/研究生錄取/工作/晉升/其他,要么卻沒有。因此,即使是連續的成績,甚至在完全不切實際的假設下,學生的成績都是衡量知識水平的完美準確的工具(顯然不是),他們仍然會遭受同樣的挫敗感。

I我本人並不是美國分級系統的忠實擁護者,但老實說,我認為分級是連續進行還是離散進行都沒有太大關係。成績是一種統計工具,應解釋為這樣-在許多分數中取平均值時,它們具有一定的(有限的)含義,但是任何一個單獨的成績都沒有太大的意義。

Kevin
2018-09-20 02:29:15 UTC
view on stackexchange narkive permalink

對於絕大多數班級,評分至少是部分主觀的。對於基於散文的類,這是顯而易見的。藝術課也是如此。但是,即使對於數學和硬科學來說,評分者也需要做出最佳判斷。當學生不正確地求解方程式時,他們唯一的錯誤是在整頁代數的雜草中插入了一個符號,那麼您是拿掉部分學分的1%還是2%?如果實驗室報告的數據沒有預期的準確性,但在一個有效位數以內,您對學生的評價有多糟糕?

因此,確切的,四位數長的原始數據您在課堂上獲得的百分比等級給人的印像是非常精確的測量,但實際上並非如此。根據評分員在查看您的項目和測試時的感受和想法的不同,您自己提交完全相同的作業時,您的評分可能上升或下降了一個或兩個百分點。假設您的原始坡度是完全準確的,則與讀取地球周向25,000英里並假設該數字精確到英寸非常相似。

因此,我認為離散字母-基於評分的評分系統實際上是對您的績效的一種更可靠的衡量標準,不會超過其準確性。部分字母等級之間的距離與我將給原始百分比等級提供的誤差幅度大約相同。因此,在將原始成績轉換為字母成績之後,您可以確信收到的成績很有可能是您應得的成績,即使考慮到分配百分比等級的主觀性,模糊性和輕微的隨機性。

Daniel R. Collins
2018-09-19 22:50:24 UTC
view on stackexchange narkive permalink

考慮成績單閱讀器的角度。他們有興趣掃描學校成績單,記錄可能有30或40個班級(獲得學士學位),而其中一半的專業則要盡快有效地進行。少量不同標記的事實有助於解析記錄。

  1. A-F方案每個類只是一個字形,而不是0-100系統的兩個字形(或三個)。
  2. 字母等級的粒度對讀者完全有用;令人懷疑的是,讀者是否在乎85%和86%之間的差異,因此一位數字通常只是浪費空間和眼睛疲勞。
  3. 自動對焦系統似乎與“魔術數字七,加號或減號2”規則兼容,該規則說從心理上講,人們可以在短時間內雜耍和評估大約5到9個離散的事物,
  4. ol>

    此外,許多非STEM類就其性質而言,對作業,表現等進行定性評分。考慮一下例如針對評分列出的策略在耶魯。列出的 first 可能的協議是“所有作業的字母等級”;列出的 second 協議是“所有作業的數字成績”,它斷言這僅是STEM課程的標準。因此,在第一種情況(可能是更常見的情況)下,在課程結束時以兩位數的精度顯示數字將是虛假的。

我認為您的觀點1是錯誤的。人們不讀字形:他們認識到比它更大的結構,而兩位數就是這種結構。這就是為什麼大寫字母很難閱讀的原因:由於您再也無法識別單詞中的模式,因此您不得不像五歲的孩子一樣,逐字閱讀。
@DavidRicherby當然,以我的經驗來看,要閱讀所有大寫字母,很難讀取2位數的分數,這可能位於第1點和第2點之間。考慮一下99、98、99、97、98、97、99、99、89,99、98、97。與AAAAAAABA A相比。我確實發現,後者使發現有意義的異常值變得容易得多。
@DavidRicherby:我不同意。解析“ 97”之類的數字並不像識別“ strawberry”一詞。數字和語言的心理結構重疊但不相同。例如,有研究表明,在心理上比較兩位數字要慢於比較一位數字(在計算上一定如此)。
很好的一點是,並非所有工作都具有數字刻度。這在我的工作室美術課中很常見,當我給論文評分以給A(例外),B(好),C(可以接受),然後將我的評論重點放在證明一個理由上時,我個人覺得比較容易92.5 vs 94.25,提供了有用的反饋。
@CortAmmon,這是因為現代數字本質上是數字的“全大寫”。使用具有老式數字的字體(https://en.wikipedia.org/wiki/Text_figures),會容易一些。
Buffy
2018-09-19 22:24:46 UTC
view on stackexchange narkive permalink

這裡有很多問題。但是,有一個問題是您提供的表格對我來說似乎並不准確-至少,我可以肯定,大多數美國大學都沒有使用它。

第二個觀點是,您認為學生可以“以較低的金額”“錯過”一個較高的分數的主張,儘管理論上是正確的,但實際上卻不那麼正確。例如,如果該課程的總分與另一個獲得較高分數的學生的分數沒有顯著差異,我永遠不會讓這種情況發生。

第三,這是一個傳統,A表示“最好的一種”,B表示“好而不是最好的一種”,C表示“可以接受”,D表示“需要改進”。是的,這些都是垃圾箱,但我認為我不能說3.22的人比3.20的人更好。我分配成績的方法並不那麼精細。等級是綜合的,不是絕對精確的度量。因此,我什至無法區分學生之間的區別。

第四,如果我們比較不同的課程,即使是同一位教授,尤其是可能在不同領域的不同教授,也可以做到3.22均值。基本哲學課程中的3.22與高級數學課程中的3.22完全相同。 IMO斷言它們是相同的,這是愚蠢的。

以上所有內容都表明,的成績確實是。垃圾箱足夠準確,例如,雇主或研究生院招生系統可以對學生的前景做出有效的判斷。當然,也有例外,但是從根本上說,簡單的 bins 表示現實要比對不存在的事物進行精確測量更好。

不要將準確性精度混淆。


還請注意“箱位分級”的心理影響。如果學生意識到只要稍加努力,他們就可以將其成績從B +提高到A-,那麼他們可能只是想付出努力。純粹的數字成績不會發生這種情況。

正如國際菸葉一樣,確實缺少更高的分數。我參加了一次物理班,期末3個學期,期末1個學期。95%,100%,95%,100%。錯過了朗誦,沒有醫生的藉口,那得到了0。我的最終成績是92.49%。儘管離截止日期有1/100個百分點,部門*拒絕*仍舍入為A,並且每次考試均獲得A的直道成績,而且成績完美。那是一所大型的州立學校,這種事情絕非罕見。它可能會非常令人沮喪,但是我仍然同意我更喜歡原始系統。
@brenzo這幾乎聽起來像是行政管理上的頭疼問題,而不是管理良好的ABC等級系統的內在問題。不知道為什麼各部門會這樣挖人。我想這有點像“預算一寸,滑一英里”。
實際上,@brenzo,,該部門在錯誤的地方尋求補救。它本來應該由教職員工處理的。他是個不講理的人。該係幾乎從未改變過教授的職等,而且可能也不會改變。
是的,這是大約5年前。我確實確實直接給教授發了電子郵件,他回答說,部門政策是從不更改成績,甚至在答復中抄送部門負責人。我完全相信他可以擁有,但是這是古老的歷史。;)這是一堂學習生活的好課-有時您只需要接受事物並繼續前進即可。
@brenzo“從不改變等級是部門政策”這沒有多大意義。如果評分有誤怎麼辦?
@user76284當然是在正確計算成績的情況下。
-1
@DanielR.Collins在四捨五入中正確。而四捨五入為92.50,最高為93。這屬於A桶而不是A-。任何獲得92.50的人都將獲得A。我的論點是,每次考試均獲得A,且其最終成績完美,為該A的1/100個百分點,並且只有一次出勤率被降低為A-不能證明我對課程材料缺乏了解,但是卻是官僚的胡說八道和被欺負。相反,它應構成減輕情勢。當然,我的要求表達得更加客氣。
因此,是的,它們是“技術上”正確的,但是有不只一種正確的方法,其中某些方法比其他方法更具常識。https://xkcd.com/1475/
@brenzo:您的成績與A成績相差1/100個百分點。與A成績相距51/100個百分點。某個地方,有一個學生竭盡所能,出勤率極高,認為他們的成績應該高於你做到了
您說“我永遠不會讓這種事情發生”是因為您將學生移至靠近邊界的地方。但這僅相當於向下移動邊界。仍然存在一個困難的臨界點,有些學生將低於該臨界點。
Jamie Clinton
2018-09-20 02:29:09 UTC
view on stackexchange narkive permalink

一半的百分比可以對學生的生活和職業產生重大影響。

在這裡您錯了。 A-和B +,A +或A等的差異永遠不會改變您的生活

這是因為:

  • 在任何學生職業中,這種變化都將趨向於均值

  • GPA可能是您遇到過的任何事情的實際重要性/給定重要性的最低比率你的生命。一旦您不再需要申請大學,這幾乎是完全無關緊要的。因為它們易於理解和比較,但最重要的是因為沒關係。成績並不定義您是誰。它們只是對您將成為什麼樣的人的不准確和次要指標,對於將學生分類到他們的大學中很有用。

  • “一旦不再需要上大學,[GPA]幾乎完全不相關。”當然,一旦您不再在手術室中,心臟外科醫師的技能幾乎是無關緊要的。但是當您在人生的那個階段時,這非常重要,而人生的那個階段對您的餘生都有非常重要的影響...
    我認為,如果有人想在學術(或與學術相鄰)的環境中工作,GPA可能非常重要。巧合的是,幾乎所有人都在這裡。
    _但是當您處在人生的那個階段時,這非常重要_-不,實際上並非如此。
    第一點是有效的,我同意最後一段。但是我們可以解決第一句話嗎?如果您依靠課程的成績來滿足某些法定要求,獲得一定的津貼或申請一些資金怎麼辦?例如,考慮在大學或碩士課程的最後一個學期中,將自己的職位排名太低而無法畢業。這發生在我的一個朋友身上。我想說這是她一生中重大的經濟變化。
    gpa並沒有定義您,而是您定義了gpa。這是你是誰的副作用,而不是你是誰的定義。
    ZeroTheHero
    2018-09-20 08:04:55 UTC
    view on stackexchange narkive permalink

    我實際上認為字母等級系統非常好。首先,它使成績具有可比性,即至少從原則上講,即使數字成績不高於95,班上的頂級學生也可以獲得A +。其次,雖然學生在某些課程中可能會倒霉,只是錯過了門檻,但在其他課程中,他們卻會碰運氣,並且剛好超過門檻:在學位課程中,這往往趨於平均。

    我的想法是,分箱系統抓住了數字標記太細的現實:89%的學生和90%的學生的能力水平沒有實質性差異。標記方案不是那麼準確,標記的差異可能是由於一些瑣碎的因素造成的,例如標記部分的疲勞或偏斜,例如在標記稍差的副本之前標記了許多非常好的副本

    學生對IMO過於痴迷於數字成績,這種分類(尤其是不考慮實際數字成績而分配A +的能力)是評估同齡組學生的良好總體方法。

    paul garrett
    2018-09-20 03:20:53 UTC
    view on stackexchange narkive permalink

    僅簡要重申一下其他答案:

    “精確數字等級”的信息內容(從信息論的角度來看)比可能出現的要低得多,即使完全缺乏有關

    顯然,許多人認為“字母等級”是“絕對的”,因此可以解決數字等級的歧義和上下文相關性。當然,首先這是不正確的,其次是等級通貨膨脹,等等。

    但是/也有離散化的優點,也可以觀察到,因為它可以在一定程度上減少對成績的關注。當然,邊緣情況仍然是個問題,但是沒有離散化,一切都是邊緣情況。

    Sam
    2018-09-20 20:50:20 UTC
    view on stackexchange narkive permalink

    所有年級都是離散的。我從來沒有老師使用非理性數字來評分。我也從來沒有一個教授在一個年級中使用超過5000個左右的“點”。換句話說,課程中所有可能的成績可以用數字0-5000唯一地描述。

    問題是5000中的3392人沒有完全捕捉到學生的知識,技能或努力程度(為什麼評分時我們會擔心努力對我來說很痛苦,但這在這裡並不重要)。

    等級代表兩件事,或者說是一件事情。首先,它們代表一個學生對其他學生的表現(在年級生看來)。其次(不是很重要),成績代表學生將來是否可以完成材料(學術和“現實生活”表現之間的聯繫充其量是微不足道的)。

    因此,給定評分的目標和問題,我們真正能做的就是將學生分為幾類,讓籌碼落在他們可能的位置。人類真的很難應對超過10個左右的類別/箱。因此,我們創建了一個約10個垃圾箱的系統,並將學生分配到這些垃圾箱。

    Ben Norris
    2018-09-22 20:02:48 UTC
    view on stackexchange narkive permalink

    短版

    此處的大多數答案都在一些數字或百分比分級方案的背景下討論了ABCDF分級方案。 ABCDF方案的優勢之一是它啟用了與數字分數脫鉤的分級方案,而是專注於掌握特定的關鍵內容。因為ABCDF場景是基於對學生成就的普遍理解的哲學,所以它允許將使用數字或百分比等級基礎的課程與可能使用精通,規格,結果或其他非數字基礎的課程中的學生成績進行比較。

    請考慮一門具有五個學習目標的課程,每個目標都由一個考試涵蓋。如果講師將C設置為考試平均值的70%,則學生可以在以下兩個極端之間通過多種方式達到70%的成績:

    • 平均成績為87.5%參加四項考試,最後一項考試獲得0%的收入(例如,獲得100%,100%,100%,50%和0%的收入),並且在所有五項考試中獲得70%的收入。

    如果學生的學習目標考試對以後的課程成功至關重要,那麼前者可能會遇到麻煩。實際上,即使考試不及格,學生也可以輕鬆獲得B。這名學生會對他們為下一門課程的準備充滿信心,但可能沒有比C或D學生更好的準備。

    例如,考慮一門涵蓋以下關鍵主題的通用化學I課程:原子結構,分子結構,溶液,化學計量學和熱化學。所有這五個主題都是許多其他化學課程的基礎。如果化學部門確定通用化學II中學生成績的最強預測指標,那不是通用化學I中的課程成績,而是化學計量和熱化學考試中的成績。他們在其他三門考試中的成績不是很強的預測指標。也就是說,與在化學實驗一中獲得C成績但在化學計量學和熱化學考試中表現出色的學生相比,在化學轟炸和熱化學考試中獲得B成績的學生更可能在Gen Chem II中獲得A。

    ABCDF計劃允許通用化學I的講師設定一個評分方案,要求通過化學計量學和化學化學的考試,以便獲得C或更高的成績並符合通用化學II的資格:

    • A級-通過所有五個學習目標的考試(得分為80%或更高),並通過高級項目。
    • B級-通過所有五個學習目標的考試(得分為80%或更高是通過),而沒有完成預研項目;或達到C級標準並通過高級項目。
    • C級-通過三個或四個學習目標(通過率達到80%或更高)的考試:化學計量,熱化學和任何其他目標。
    • D級-至少三個學習目標的及格考試(分數為80%或更高),但未達到C級標準;換句話說,您的化學計量學,熱化學或這兩項考試均未通過。
    • F級成績為通過少於三個學習目標的考試(通過率為80%或更高)。

    如果導師讓學生有機會重新參加他們幾乎通過的考試,比如說通過交上作業的門檻或完成一定數量的可選複習測驗,我們實際上消除了“刀鋒”問題。在我的情況下,永遠不會有擁有92.7%的學生獲得A-的學生,而擁有93.1%的學生將獲得A-的學生。學生通過或不通過高級項目。這種規範樣式的分級在一定程度上模擬了生活。在工作中,員工在截止日期之前完成了一個項目,或者沒有完成。

    但是,即使我使用這樣的評分方案,我仍然基於我的評分理念,即A的成績是為成績最高的學生保留的,而B的成績是為了保留成績的。掌握了大多數課程的學生,C等級保留給在我的課程中學到的知識,以便在下一課程中取得成功; D等級保留給在我的課程中學到的東西但還不夠的學生為了在下一門課程中取得成功,F的成績只保留給我無法確定他們在我的課程中學到什麼的學生。儘管確定A的方法截然不同,但這種哲學使我的A可以與其他教師的A相提並論。

    在一個系統中,我需要使用某種數字成績來記錄學生的成績,無論是百分比或百分位數,我永遠無法運行這樣的評分方案。而且我更喜歡這種方案,因為它迫使我的學生專注於學習和掌握關鍵材料,而不是使用基於積分的系統玩數學遊戲。

    Roman Odaisky
    2018-09-20 22:19:36 UTC
    view on stackexchange narkive permalink

    0-100評分系統在幾個方面都存在問題。

    首先,讓我們假設一個學生的真實知識水平可以用[0,1]中的數字有意義地表示,並且成績是教授們最大的努力來估計這個數字。一位教授的職能最終將是向上凸的,而另一位教授的職能將是向下的凸,一位將轉換0.5%至40%,而另一位將同一學生的評分定為60%。

    對於教授來說,這甚至沒有意義試圖在他們的腦海中定義這樣的功能。如果問題已正確解決,但採用的方法效率低下,則表明該學生未能掌握更合適的方法,那麼該值100%嗎? 90%? 80%? 84.2%?對數千種可能的因素分別應用什麼權重?更不要說評分會隨著教授瀏覽學生的論文而變,因為它太模糊了。令教授個人感到煩惱的事情,大多數人本來不會因為小事而將A變成B。

    離散系統可以更輕鬆地形式化。就像數學奧林匹克競賽:您正確解決了嗎?您得到7,沒有方差。

    大多數領域的專業人員都以其估計複雜事物參數的能力而感到自豪,但是研究後又會學習(我認為Kahneman在他著名的 Thinking,Fast中引用了一些內容和Slow)表明,許多此類專業人員在類似於APGAR評分的最簡單方法上始終表現出色。

    Bristol
    2018-09-24 19:19:54 UTC
    view on stackexchange narkive permalink

    我不是美國體系的專家,但英國體係也曾經這樣做,它以學位分類或“榮譽”為基礎(第一,2:1、2:2,第三)

    我一直以來都理解的想法是

    • A表示學生對主題材料的理解明顯超出了課程中所教的內容。課程
    • AB顯示該學生已實現了我們打算教的內容,也沒有更多的“挑剔”的想法。
    • AC顯示該學生已經了解了基本概念,但還沒有達到我們的期望

    所以離散的成績等級基於對主題材料的質的不同理解。我們的一位工業合作夥伴還告訴我,有些工程師可以給您解決問題,他們會解決問題,而工程師會在您意識到之前就為您提供全面解決方案項目經理),某個地方存在問題-並且這種區別與獲得二等或一等學位有著顯著的相關性。

    所以我的回答是,如果離散垃圾箱確實有意義,習慣於對定性信息進行編碼,例如哪些學生會在沒有太多提示的情況下超越您的教學。

    英國系統的另一個方面是明確告知了我們(至少在我看來大學)不要在曲線上標出:“首位” /“完成”的比例應僅由工作質量決定,並且每年可能(確實)有所不同。

    就是說,我為之撰寫推薦信的幾位雇主都有一個在線表格,必須在其中選擇我要為其撰寫推薦信的學生

    • 同類群組前1%
    • 同類群組前5%
    • 同類群組前20%
    • 同類群組前50%
    • 不在同類群組前50%

    ,您會感到很明顯,他們不會問這個問題,如果他們不以某種方式使用它來確定邀請誰參加面試。因此,您可以作為一所大學嘗試不要“在曲線上得分”,但是雇主會對此做出反應。如果特定排名的含義與特定的能力標準結合在一起,並且每年允許您更改您每年頒發的“ A”級分數的百分比,則該排名的含義每年都會發生變化。

    WGroleau
    2018-09-20 09:48:30 UTC
    view on stackexchange narkive permalink

    我認為這部分取決於課程的性質。作為電子學的(前)老師,我可以說ABCDF太細了:

    • 學生能否識別出削波信號?
    • 學生可以測量電源上的電壓嗎?還是沒有測試點?

    但是美術課是非常主觀的。

    有人可以從例如80分對79分得出這些問題的答案嗎?
    他們達到了目標或沒有達到目標。兩種選擇。有些事情可能是模糊的。有些東西不是。
    好的,但是您已經給出了兩個目標。因此,至少有四個可能的等級:兩者都不可以,可以識別但不能測量,可以度量但不能識別,可以同時進行。似乎並沒有直接映射到任何等級。長話短說,我不太確定這個答案與問題之間的關係。
    如果您不能兩者都做,則說明您還沒有做好準備。
    所以您在這種情況下提倡通過/不通過評分?我認為您可以編輯此答案以使其更加清晰。
    這個答案也讓我感到困惑。在電子領域,識別削波信號是否是整個課程的唯一目標?
    當然不是。關鍵是技術人員必須具備某些特定技能。雇主(海軍)不需要75%的技術人員。或者換一種說法,這是有原因的,您甚至可以在大學中找到通過/失敗課程。
    @Wgroleau誰對海軍說了什麼?如果我對您的理解正確,那麼您提出的課程有兩個目標:識別削波信號和測量電壓。如果學生既可以做到又可以做到,則應該得到A,如果他們不能同時做到,則應該得到F。那是對的嗎?
    問題是ABCDF是否不夠精細。我的回答是,有時它過於精細。


    該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 4.0許可。
    Loading...