亞太科學教育論壇, 第九期, 第一冊, 前言(二零零八年六月)
楊寶山
科學課程學業成就調查的實施
上一頁 內容 下一頁

科學課程學業成就調查的主要方法

在科學學業成就調查(評價)的方法上,宏觀監測大都是以紙筆測驗和問卷調查為主。目前,以自適應理論為依據的電腦因人施測技術和成長記錄袋評價的運用逐漸增加。在問卷調查中,可選擇學生、教師、校長或家長等作為對象;有時進行必要的訪談、實地觀察及相關文本分析等,可進一步瞭解學生學業成就差異的成因。

在調查物件的選擇上,常採用分層抽樣技術。例如,在PISA調查中,設計為兩階段分層取樣,第一階段的取樣單元為含有15歲學生的學校個體;取樣之前,將在取樣範圍內的學校(學校的最低參與率為85%)或內隱或外顯地分配到層;然後,以隨機抽樣的方式在每層抽取學校,各層之抽取率與各層學校多少及學校內的學生數量成正比。第二階段的取樣單元為樣本學校中的學生個體,從每一所樣本學校中等概率抽取35名學生(底線為20名)。所抽取考生的作答率要求達到80%(底線為50%)。為了保證樣本的總體覆蓋率,學校和學生層面的總排除率必須低於5%。

在TIMSS的科學知識的測試和調查中,除了測試和問卷調查之外,還包括課程分析、數學課堂的錄影、觀察和有關政策的研究。它的設計集中在學生的三個不同的學校階段:小學後階段、中學低年級階段和中學的末尾階段。由於每個國家學生的入學年齡不完全相同,學生被測試時必須考慮年齡和年級兩個因素。

有關學校、教師和學生的問卷調查,主要調查學生的科學學習的情況以及對科學學習的信念;教師問卷主要調查教師對科學的信念和關注教學實踐的信念;學校問卷主要調查校長對學校政策和實踐問題的看法。

在課程分析中,主要對科學課程的指導書和教科書進行比較,研究科目的內容、內容的銜接和對學生成績的期望等。他們通過對課堂教學進行觀察,對教育管理部門、校長、教師、學生和父母進行訪談。研究的內容包括教育標準、處理個性差異的方法、教師的生活和工作狀況以及學生生活等對學校教育的影響等。

NAEP的科學評估方法基於相同的評價框架指導,使用相同的評估程式,以及整個評估使用了有效的評估工具:大型題庫和矩陣技術,並在不同年份的測試、不同年級的測試卷中特意安排了一些重疊的問題,與其他類型的測試共用部分相同的樣本,使得測試結果既有縱向可比性,又有橫向可比性。科學評估量表由學生問卷、教師問卷、學校領導問卷等組成。

在NAEP的科學評估中,在參加評估的州內根據人口統計學和地理組成進行抽樣。為保證樣本的均衡性,NCES和NAGB規定州和地方學校的參與率不得低於85%。通常在各州4年級和8年級各選取100所學校作為樣本,再在作為樣本的學校和年級選取25名學生參加每個科目的評估。

在測試時間方面,該組織制定了詳細的評估計畫表。全國評估通常與州評估和實驗性城市地區評估是隔年進行並且避免重迭,而全國長期趨勢評估則是四年一次。今年(2008年)進行全國長期趨勢評估。

在APU的科學評估中,由於學生和考題都是以隨機方式抽樣,因此兩方面的樣本都應具有代表性。在學生試卷的設計方面,由於評估所牽涉的內容專案眾多,每次測試只能評估部份項目。每個子項目都設有一個試題庫,部份試題適用於兩個或三個年齡組別,以便於比較跨年齡的成就差異。在筆試前或後,會抽取部份考生進行實作測試。

在學校問卷的設計方面,包括科學教學的師資和資源,進行科學教學的目的,對科學教育的重視程度,分配予科學教學部門的財政資源等。在學生問卷的設計方面,主要考察學習環境與學生學業成就差異的關聯。如學生的性別,種族,修讀科目,職業取向,對有關科學議題的興趣;問卷亦問及學生課餘的興趣及嗜好等。

在中國內地的科學評估中,由於多種原因,我國大陸雖然未整體直接參加IEA和OECD等國際評價組織的學生學業成就評價專案,但是從20世紀70年代後期開始,我國的理論界先後參照布盧姆等的教育目標分類框架,從認知、技能、情感態度和學生品德等多方面地進行了引進、吸收和本土化改造。20世紀90年代起,我國在學生學業成就現狀調查和影響因素分析方面進行了多次的探索和實踐。“十五”課題以來,特別是自新課程實施開始,一些專案組、課題組進行了廣泛的理論研究和實踐探索,並且已經取得了一些具有重要意義的成果。

 


Copyright (C) 2008 HKIEd APFSLT. Volume 9, Issue 1, Foreword (Jun., 2008). All Rights Reserved.