閱讀屋>考試> 歷史學科考試評價分析論文

歷史學科考試評價分析論文

有關歷史學科考試評價分析論文

  為了便於說明問題,在這裡我們把定性和定量分析的內容改編為一種評價標準,並按當前歷史科考試的構成分為試卷、試題、評分三個部分。

  一、試卷

  一、試卷設計體現《歷史科考試說明》的各項要求。

  《考試說明》是依據《教學大綱》制定的,它和大綱不同的地方是對考試的一些技術性問題和實施問題做了規定。這主要是:考試的能力要求;考試形式及試卷結構,其中包括考試的方式和時間、試卷的分類、考試內容的比例和題型的比例;考試的知識範圍。

  《考試說明》是聯絡《教學大綱》和考試的紐帶,在標準化考試的各個環節中,《考試說明》集中體現了標準化考試的透明度要求,也是用以評價試卷、試題的主要標準之一。

  二、考查歷史學科的主體內容

  所謂主體內容一是指中學教學的重點內容。考試的內容要和教學的內容一致,更要和教學的主體內容一致,不然,考試就失去了它的有效性。其實,所謂主體內容,在《教學大綱》中有透徹的解釋,歸納起來就是:反映歷史整體面貌和發展線索的內容;反映歷史演變規律的內容;反映辯證唯物主義和歷史唯物主義的基本理論和方法的內容;反映國情的內容。

  另外,主體內容亦指與大學學習相關密切的內容。這部分內容是指建立在主體知識之上的與大學學習相關密切的學科理論和能力方面的內容,即指對歷史事物和歷史現象的綜合、分析、評價的能力。

  三、反映學科的內部聯絡和基本規律

  這實際上是對試題科學性的總要求。所謂學科的內部聯絡有兩層含義,一是體現歷史事物、歷史現象之間的本質關係,不能孤立地考查知識點,不能片面地、錯誤地解釋歷史事實。二是試卷內容對學科各部分內容的考查要有整體性,也就是說堅持合理的內容比例,這個比例一旦失調,內部聯絡也就難以全面地反映出來。所謂基本規律,是指試題的設計要以辯證唯物主義和歷史唯物主義為指導,引導考生通過歷史現象認識人類社會發展的客觀規律。

  四、全面考查學科的各種能力要求

  現在公佈的歷史學科能力共有十項要求,其中第一、二項是識記、理解的要求,做為最基礎的能力要求是肯定要考到的。三、四、五項是對歷史材料和歷史資訊的處理能力,由於材料題的數量有限,不可能針對每一項能力要求出一道題,只能是綜合性地設計題目內容,把能力要求包含進去。六、七、八、九項是敘述、分析、綜合、評價能力的要求,也做綜合性處理。

  五、題目難、中、易比例合適,總體難度得到有效控制。

  題目難度的控制有這樣幾層含義:其一,大部分的題目難易程度應該在0.3-0.7之間,這個幅度裡的題目,其難易程度又應相對集中在0.5這個區域裡。其二,全卷題目難度應該難、中、易交替出現,逐級由易到難。從我們的試題安排上可以看出,先是選擇題,中間是材料題,最後才是問答題。在每一部分中,難、中、易不是呈扎堆狀態,而是交替分佈。這樣,全卷的總體難度才能得到有效控制。

  難度是一個相對的概念,通常人們認為0.5-06之間是合適的區域。當然,如果需要,也可上下調整到其它區域。

  六、試卷長度合適

  試卷長度是指試題的數量和參考答案的文字總量之合,試卷過長或過短都會影響考試的信度。在目前的高考中,在規定的時間內在50%以上的考生完成全卷內容,這個長度就是合適的。從現在的情況看,試卷長度是比較合適的,有的考生做完全卷後尚有時間檢查。

  二、試題

  一、測試目標明確

  任何題目的設計都要體現具體測試目標,這樣才能夠有效地限制題目的隨意性,達到規範化和標準化。歷史學科的測試目標大致可分為幾類,一是對知識內容掌握的準確程度;二是對知識內容掌握的深入程度;三是對歷史事物內部聯絡的認識程度;四是理論與史實相結合的水準,五是歷史意識。在這五類目標範圍內又可以分為許多小的類目。在實際操作中,一道題目往往含有一個以上的測試目標,但幾個測試目標在題目中不能平分秋色,要有主次之分。

  二、試題科學、規範

  試題不能出現科學性的錯誤。有些問題雖然不能算作錯誤,但它存在爭議,遇上這類問題應相當慎重。另外,試題的科學也表現在題乾和參考答案的對應,題目的測試目的,它所涉及的知識範圍等等,都必須在參考答案中有相應的表述,其層次、範圍、幅度就都是一致的。不能題幹龐大,而答案很窄,也不能題幹要求很少但答案要求很多。

  規範的含義是題目的設計要符合歷史學科的特點;在表述上有相對固定的形式;在格式和語言的運用上符合國家規定的標準。

  三、題目角度新穎,立意深刻

  在就要求題目的創設應不句泥於教材的表述,設定新的情境,從新的角度提出問題,這樣的題目往往都含有較深的立意。如把焚書坑儒和八股取士相聯絡論述問題,這自然就要求從這兩個歷史現象之間的內在聯絡上尋找一個共同角度去展開。把榷場和民族關係相結合也反映了這樣的問題創設新的情境,是測量對已有知識掌握程式的最有效的辦法。

  四、題意明確,表述方式合理

  考試當中有時會出現因題意不明或由於考生對題目的表述不理解而出現了審題錯誤,這是造成誤差的一個原因。

  題意明確首先是命題者對題目所涉及的知識內容準確掌握,其次是對測試目標有準確理解,再是對知識內容和測試目標之間的關係準確把握。題目的表述方式應該選擇最簡潔、有效的書面語言。

  五、題目型別和題型比例合理。

  題目型別比例是指主觀題和客觀題的比例。目前歷史科高考試卷主、客觀題的比例是各佔50%。在客觀題尚未發掘出更好的測量辦法的情況下,這個比例是合適的。大多數的考生往往是在主觀題這一部分拉開檔次。題型比例是指各類題型所佔的比重。前邊我們已經提到選擇題、填空題、材料題、問答題的比例,它們基本上呈金字塔形狀,這種形狀是為了有效地實現考試目的。它一方面反映了對基礎知識的重視,另一方面反映了對學科能力的要求。這種狀況在目前情況下能夠較好地區分考生。

  六、有較好的區分度

  區分度指試題對不同水平考生的鑑別能力,對於區分度的掌握,有從整體上看的,也有從區域性上看的,亦有從一道試題上看的。從整體上看,全卷的區分度應該在0.3以上,說明試卷整體的鑑別能力較好。全卷區分度好不等於要求每道題都在0.3上,但在考查主要學科能力的試題上或綜合性較強的試題上要求有較高的區分度,這類試題往往是材料解析題、問答題和部分選擇題。在這些題目中,區分度的要求也是不同的,它們之中亦有很高、較高之分。總之,區分度也有一個根據命題意圖合理佈局的問題。

  區分度和難度有著密切的關係,太難、太易的題目都不會有好的區分度,只有中等難度的題目才會產生好的區分度。根據這一原理,目前歷史科考試中的問答題裡出現了考查再認、再現能力和分析、綜合、評價能力相結合的形式,使題目達到一種不難不易的狀況,以求達到好的區分度。當然,問答題最理想的設計還是從思維的角度劃分層次,這樣能充分利用題型的功能。

  以上是對於各種試題總的評價目標,但具體到不同型別的試題,也有不同的要求:

  [客觀題]

  一、試題內容適合使用選擇題

  從理論上說,選擇題應該可以考查各種內容和能力要求,但目前對於選擇題的功能尚未完全發掘出來,也由於受到試卷長度的限制,所以有的內容不適於選擇題使用。比如考查敘述、論證、對歷史材料中所含有效資訊的篩選等,在選擇題中難以實施,尤其是涉及理論的內容,弄不好就會形成模式化、概念化的'東西。這幾年,實際上用於選擇題方面的內容在不斷擴大,由最初的考查再認、再現能力的內容,擴大到理解、分析、綜合甚至評價的內容。選擇題的發展方向是在發掘題目多樣化的同時注重考查歷史思維水平。

  二、題幹圍繞一箇中心,選項和題乾的關係一致

  題幹圍繞一箇中心,首先,題幹必須有一個相對完整的中心問題,不能將題幹要表達的意思放到選項中去。其次,題幹不能產生歧意。選項和題乾的關係一致是指選項和題幹圍繞一個共同的問題,不能出現與題幹所問無關的選項。

  三、干擾項有效

  干擾項有效是指對正確項的干擾有效。一道選擇題出的是否成功,除了正確項無誤外,干擾項也相當重要,因為它起到了調節試題難度的作用。如果幹擾項不起干擾作用,易被學生排除,試題難度就會下降,因為學生不用對正確項進行分析,只憑排除錯誤項即可做答,這樣,不僅難度下降,區分度也會隨之下降。所以,干擾有效也存在一個程度問題。這個程度的控制標準就是使試題達到中等難度為最合適。如何使干擾項有效呢?一是干擾項和正確項對試題題乾的關係應該一致,這個在前邊也講過;二是干擾項應該代表考生的典型錯誤,否則,就會出現干擾項太易或大部分考生把某一干擾項做為正確項的情況。這樣,考試的有效程度就會降低,在選拔性考試中,這一點顯得尤為重要。

  四、各選項的結構、長度大體一致

  這實際上是要求各選項要整齊。結構是說句式、用詞、語氣要大體一致,不能出現迥然不同的表述,這樣容易帶來某種暗示,或者引起評分上的分歧。長度是說文字長度要大體一致,一般來說,選項的文字不宜過長。如果文字不長不足以表述一個相對完整的意思,那麼就要考慮重新設計題目內容。

  五、正確選項比例分佈合理

  從總題量的角度說,正確項應該大致均勻地分佈在四個選項中,這會降低猜題、蒙題的可能,提高考試效果。在多選題當中,正確項存在一個比例問題,原則上正確項不能集中在某一數量上,也要有所分佈,同時分佈要均勻。

  [主觀題]

  一、題目設計體現運用已有知識解決新問題的能力考查要求

  運用已有知識解決新問題的能力是對學科能力要求的一個概括性表述。它體現在試題設計上應該包含這樣幾層意思:其一,題目涉及的內容在教材中有依託。其二,題目要設計成不同於教材表述的新情境。其三,題目要引導考生對歷史現象進行新的認識。

  這裡邊第二條最不容易做得好。因為新情境的設計首先受到教材的制約,往往是新情境同時也會帶來許多的新的內容,如果這些內容在教材中沒有涉及到,就要進行修改、剪裁,弄不好會給人以削足適履之感,有時甚至會失去新情境的意義。在歷史學科中,所謂新情境實際上就是人們認識歷史現象的新角度或展示的新材料。這些東西不是文學創作,可以由命題者去編制,它必須來源於既有的材料和現實中人們在研究歷史現象時所認識到的那些問題以及認識角度,它的規定性很強,要恰當地把它們改造成一種新情境並與考生已有知識對接,這實際上是一種特殊的創造性勞動,做到天衣無縫相當不容易。當然,這並不意味著新情境都會帶來新角度,命題者不能一味單純求新,關鍵還是要看新情境有沒有一定的深度,它自身的認識價值如何。這也是我們評價問答題時應注意的一個問題。

  二、考查較高層次的學科能力

  歷史學科十項能力要求中,涉及對歷史材料的分析運用能力、論證能力、評價歷史事件、歷史人物的能力應該是較高層次的學科能力。這幾方面的能力有些共同特點,一是理論水平要求高,二是對歷史材料和資訊的處理水平要求高,三是對文字表述水平要求高,總的來說,較高層次的能力要求綜合性強。

  較高層次的學科能力是以較低層次的學科能力為其基礎的。在主觀題的設計中,命題者很注意由較低層次向較高層次的深入梯度,也就是說,涉及再認、再現歷史事實、敘述、理解的能力要求在主觀題中仍佔有一定的份量,所以,確切地說應該是重點考查較高層次的學科能力。

  三、難度和答題量與賦分值合理

  賦分值是指題目在全卷總分當中的比值。歷史學科四種題型的賦分值不同,從每道題來說,填空題0.5分;選擇題1分、2分;材料解析題9分左右;問答題12分左右,由此可以看出,賦分值是隨著試題的難度和答題量的增長而增長的。那麼,對於賦分值與難度、答題量的關係的含義就應該這樣認識:賦分值是考試內容含量的顯示,它反映支付思維活動和文字表述活動的程度。難度和答題量的控制依據是賦分的比值。

  但是這裡邊有兩個問題需要注意,一是賦分值和難度、答題量的關係在同一題型內是相對整齊的,但不同題型相比較就複雜一些,比如十個1分的選擇題和一個10分的問答題的比較只能是大致整齊。在主觀題中,應特別注意分數的分佈和難度、答題量的比重。比重應體現能力考查的要求,應體現對學科深層含義的理解。二是主觀題的難度相對地比客觀題的難度要高一些,不能用整卷的平均難度值去衡量主觀題的難度。另外,主觀題的難度和答題量關係要具體而論,通常,涉及再認、再現歷史事實的內容,即使文字量多,但難度不高,賦分也較少;涉及綜合、分析、評價的內容,即使文字量不多,但難度較高,賦分也多一些。

  三、評分

  一、參考答案及評分標準具有科學性和可操作性

  科學性是指參考答案和評分標準無科學性錯誤,另外,亦指程度合適。對於選擇題來說,答案就是正確選項,在設計正確選項時就要考慮到它的科學性和程度問題。程度包含難度,也包含其它的因素,如應排除正確選項的偏、怪現象以及它和干擾項的內容是否平衡等等。

  對於主觀題來說,科學性首先是指參考答案和評分標準科學合理。另外,重要的是要看參考答案是否體現了一個相對完整的科學含義,是否揭示了題目各個因素之間的內部聯絡。可操作性是指評分標準應與參考答案相呼應,相一致,同時又有一定程度的變通性,也就是說,評分標準對答案來說既是給分的依據又是變通的依據。這要求評分標準的含量要大於具體的答案,要能放得開又能鎖得住。總之,評分標準應能夠應付對同一問題的各種理解的表述。

  二、主觀題評分既能有效地控制評分誤差,又能鼓勵考生有創見地答題

  控制評分誤差和鼓勵有創見地答題是一對矛盾。控制評分誤差是要求在評分中儘可能具體地設想考生的各種思路,並在評分中予以規定;鼓勵有創見地答題則要求題目是開放性的,但題目的開放會給評分的實施中自然顯得不好操作,變通無依據。題目越開放,評分誤差就越難以控制,這是各科考試中遇到的普遍問題。因此,這條評價標準只能是相對而言,我們只能從題目在多大程度上鼓勵了考生有創見地答案,在評分中是否相應地採取了控制誤差的方法,這就是說,題目向前發展了一步,評分也要向前發展一步,二者應該是相輔相成的。

  就歷史學科來說,控制評分誤差有幾個環節應該抓住;其一,題目的考查目標要在評分中體現出來;其二,考查目標應被分解成得分等級,每一等級應概括考生中的幾種答題情況;考查目標的主體內容應分佈各得分等級中,主體內容是決定基本分的主要依據。其三,構成答題的其它因素如文字表述的邏輯聯絡,對問題的展開程度、歷史材料的運用等等也應制定量表予以等級化。

  鼓勵考生有創見地答題對題目的要求大致是這樣的,它應該擺脫生硬的一問一答的模式,題目的面貌基本上不是在提出什麼需要回答的問題,而是提出一個共同討論的問題,這樣才談得上“鼓勵”。“有創見”對於題目來說,就是材料的組織更巧、問題的切入更新,使考生對已有知識能有新的組合發揮才可能“有創見”,也就是說,要把教材套在題目上是無路可走的,非得“創見”一點不可。當然,對於各種“創見”的可能性,要給以充分估計,並體現在評分標準上,以免評分失去依據。

【歷史學科考試評價分析論文】相關文章: