閱讀屋>行業> 本科生統計學畢業論文

本科生統計學畢業論文

　　1統計設計存在的常見問題

　　統計設計是整個研究中最重要的一環,是研究工作應遵循的依據。常見的統計設計問題有:忽視組間均衡性,樣本缺乏代表性,樣本例數不足,未設定對照組,未隨機分組,未提出統計分析方法等。針對以上問題,在科研設計中一定要遵循實驗設計的四大原則即“隨機、對照、均衡、重複”的原則[6]。

　　1.1不遵循或不重視隨機化原則

　　隨機化是科研設計的重要原則，直接影響研究結果的可信度。隨機化既要隨機抽樣，還要隨機分組，並有足夠的樣本量作前提。然而，在醫學論文中許多作者對此不夠重視，主要表現在論文中統計處理隨機化不突出，隨機化缺失情況比較常見，有的論文甚至將隨機誤解為隨意、隨便，不採用隨機化處理方法，導致結果缺乏可靠性。還有些文章中沒有提出“隨機”抽樣的設計與方法，沒有排除標準，給人隨意選擇病例之感，且病例數少，因此沒有代表性，所得出的結論不可靠。部分文章雖然註明了“隨機”，但未提及採取什麼方法進行隨機化研究或兩組間的例數相差甚遠，不符合隨機化的一般規律，沒有臨床參考價值[7]。

　　1.2缺少對照研究或對照組設計不合理

　　正確設立對照是臨床或實驗研究的一個核心問題，設立對照的意義在於說明臨床試驗或實驗研究中干預措施的效應，減少或防止偏倚和機遇產生的誤差對試驗結果的影響。目前，國內許多期刊發表的論文對照組設計不合理現象比較普遍，尤其有些作者對某種新藥或新技術在臨床的應用觀察研究中，不設對照組，缺乏對照觀察，得出的結論缺乏科學性，令人懷疑。有的文章雖然設立了對照組，但在分析結果時，卻沒有將試驗組與對照組的結果進行比較，而僅將各組間的自身前後進行比較，從而使該研究失去對照意義。對照組選擇不當，還表現在兩組間重要的臨床特徵和基線情況相差太大，無可比性，如性別、年齡、病情、經濟情況和文化程度等不一致，如有些論文將健康人或志願者作為對照組，使結果受到非處理因素的影響，產生偏倚或系統誤差，使結論不可信[7]。

　　1.3均衡性原則掌握不夠

　　均衡性原則要求實驗中的各組之間除處理因素不同外，其他可控制的非處理因素要儘可能保持一致。特別對疾病預後有重要影響的臨床特性一定要在組間分佈均衡。各組間越均衡，可比性越強。有些作者在對病例進行分組時，忽視了均衡性原則，兩組之間沒有可比性，結論自然是錯誤的。具體表現在：有的文章對治療組與對照組的相應統一指標沒有設在均衡的水平上。對治療組情況交代的比較詳細，而對對照組的年齡、性別、病情等不予交代，或所選對照組的年齡與治療組不在一個年齡段，影響了作者對指標的觀察[7]。

　　1.4重複的原則掌握不好

　　所謂重複,一是指重複試驗或平行試驗,二是指各樣本組的例數要有一定的數量,即樣本的例數要足夠大。雖然隨機化是增強非處理因素均衡性的重要方法,但當各組內例數過少時,儘管採用了隨機化分組的方法,也難以保證非處理因素的均衡一致。在隨機化分組的基礎上,只有樣本例數足夠大,才能使非處理因素均衡一致,同時也才能使抽樣誤差減小,增強樣本對總體的代表性。一般來說,在隨機分組的前提下,樣本例數越大,各組之間非處理因素的均衡性越好;但當樣本量太大時,往往又會給整個實驗和質量控制工作帶來更多的困難,同時也會造成浪費。為此,在實驗設計時,還應保證在實驗結果具有一定可靠性的前提下,確定最少的樣本例數。一般說來,計數指標每組樣本不得少於20～30例,計量指標每組樣本不得少於5～10例。在多因素分析時,一般認為樣本例數至少為觀察指標的5～10倍[8]。

　　1.5樣本的含量

　　樣本的含量的大小直接影響到結論的可靠性。樣本量過少,則抽樣誤差大,結果可靠性差,且經不起重複驗證;反之,盲目加大樣本量也會造成人、財、物的浪費,同時也造成非抽樣誤差增大。故應在保證研究結果精確可靠的前提下,確定最小的樣本量。如某篇論文報道某藥治療的臨床療效,實際總例數為10例,其中6例有效,於是作者得出有效率為60%。顯然,有限的病例數不能充分說明該藥是否有效,作者貿然得出結論,容易給他人造成假象甚至誤導[9]。

　　2統計方法選擇與使用不當

　　在選擇統計方法之前,首先應確定研究資料是計數資料還是計量資料。只劃分其類別而得到的資料為計數資料,也叫定性資料,如根據治療結果計算出的治癒率、陰性率、陽性率等。測定某個具體數值而得到的資料為計量資料,如血壓值、血細胞計數、血氧分壓測定等許多物理診斷和化驗檢查的結果。目前,醫學論文中計數資料最常用的統計方法為χ2檢驗,計量資料最常用的統計方法為t檢驗。值得注意的是,各種假設檢驗方法均有其適用條件,應根據資料特點來選用最適當的方法。均數與標準差分別是描述正態分佈資料集中和離散趨勢的指標。能否選用“均數±標準差”來描述某一資料的分佈特徵,關鍵看該資料是否符合正態分佈。當資料不符合正態分佈或方差不齊時,應將資料轉換使之符合正態分佈,方差齊性後再用t檢驗或方差分析,否則用秩和檢驗。有些作者在使用t檢驗時,未考慮到上述適用條件而盲目使用,造成統計學處理不當或統計學計算錯誤[10]。

　　2.1統計指標應用不當

　　2.1.1描述計量資料的統計指標描

　　述計量資料的統計指標主要有平均數指標(算術均數、中位數M等)和變異指標(標準差s和四分位數間距Q等),在應用時一定要注意它們各自的適用範圍。對於非對稱分佈資料,算術均數不能反映資料的平均水平,應採用中位數描述。一般地,正態資料或對稱資料用描述,偏態資料用M和Q來描述。在不能確定資料的分佈型別時,應選用M和Q進行統計描述。四分位數間距Q是75%分位數P75和25%分位數P25之差,即Q=P75-P25,所謂百分位數Px是將全部觀察值分為兩部分,理論上x%的觀察值比它小,(100-x)%的觀察值比它大,中位數M是50%分位數P50。、s、M、Px與Q可透過統計軟體直接輸出[9]。

　　2.1.2描述計數資料的統計指標描

　　述計數資料的統計指標有絕對數和相對數。絕對數是原始資料經彙總得到的小計或總計數。相對數是兩個有關的絕對數之比,主要包括率和構成比(百分比)。醫學論文中相對數應用的主要問題之一是分母較小。分母較小時,相對數的可靠性不能保證,在這種情況下,宜直接用絕對數進行描述而不宜計算相對數。醫學論文中相對數應用的主要問題之二是將構成比誤用來說明事物發生的強度。構成比只能反映事物的內部構成,不能說明事物的發生強度。醫學的研究物件主要是人以及與人體有關的各種因素。由於生物現象的變異較大,各種影響因素又錯綜複雜,研究常是抽樣觀察,使事物本質差異與抽樣誤差混雜,故需用統計方法透過偶然現象來探測其規律性。如果不能正確運用統計學方法,造成統計學上的偏差或失誤,就很容易把本來成功的結果當成失敗而放棄,或把失敗的教訓誤認為成功的結論而加以宣傳。在進行科研設計時要嚴格遵循科學的統計學分析方法,不能留下隱患,否則,再高明的統計學專家和統計學軟體也無法彌補科研設計缺陷造成的損失。總之,統計學分析在醫學研究和論文寫作中意義重大。作者在撰寫論文時,應注意識別、總結有代表性的、有借鑑意義的統計學領域的缺陷、失誤或錯誤的多發點,特別留心易出現統計錯誤的險區,從而使論文中的統計學問題減到最低限度。認真檢查、仔細核驗,儘量避免上述錯誤,必要時還可以請統計學專家幫助把關[12]。

　　2.2統計方法描述或選擇不當

　　統計方法選擇非常重要，它直接影響結論的可靠性[12]。臨床資料的結果變數可分為計數資料、計量資料和等級資料。計數資料指將觀察物件按兩種屬性分類，如生存、死亡，治癒、未治癒，有效、無效等，通常轉化為率。如果是兩組間的比較，則採用四格表χ2檢驗或其校正公式，如果是多組間率的比較，則採用行×列表資料χ2檢驗。計量資料指對某一個研究物件用定量的方法測定某項指標得到的資料，一般均有計量單位。通常資料呈正態分佈時，兩組間均數比較用t檢驗，多組間均數比較用方差分析和q檢驗。當資料不呈正態分佈或方差不齊時，也可用秩和檢驗等非引數檢驗法。

　　2.2.1統計方法描述不清

　　醫學論文中常可發現作者未交代所用的統計方法，如是配對設計的t檢驗還是成組設計的t檢驗，是Ridit分析還是χ2檢驗，是作相關分析還是作迴歸推斷。統計方法交代不清或根本不予交代，使讀者對論文結論的正確與否無法判斷。有的作者只提一句“經統計學處理”後，就寫出結論。有的甚至直接用P值說明問題，籠統地以P<0.05或0.01、P>0.05便稱結果差異有無顯著性，P值的大小不說明差值的大小，它還與抽樣誤差大小有關[13]。因此，還應寫明具體的統計方法，如有特殊情況，還應說明是否採用了校正，應寫出描述性統計量的可信區間，註明精確的統計量值和P值，然後根據P值大小作出統計學推斷，並作出相應的醫學專業結論。

　　2.2.2假設檢驗方法交代不清不交

　　代假設檢驗方法或假設檢驗方法交代的不具體、不清楚是醫學科研論文中常見的錯誤。如果不交代假設檢驗方法或假設檢驗方法交代的不具體，讀者就無法考察論文的統計學方法選擇的是否正確，無法核對計算結果是否準確。每一種假設檢驗方法都有其特定的適應條件和嚴格的適用範圍。對於同一組資料，採用不同的假設檢驗方法可能得出截然相反的結論。如將配對設計的資料按成組設計資料的方法處理，將會損失樣本提供的資訊、降低檢驗效率，可能使原本有統計學意義的結果無統計學意義[14]。在論文寫作時，不但要交代選用的是什麼統計學方法，而且統計學方法要儘可能具體。如選擇t檢驗，要說明是配對t檢驗，還是成組t檢驗;選擇方差分析時，要說明是完全隨機設計的方差分析，還是配伍組設計的方差分析。對於四格表資料，應說明是一般四格表χ2檢驗、配對四格表χ2檢驗及四格表資料的精確機率法等。

　　2.2.3統計方法選擇常見錯誤

　　①誤用χ2檢驗。χ2檢驗有一定的適用條件,n>40且理論數(T)>5時,可用一般χ2檢驗;n>40,但至少有1個T>1且T<5時,可用校正χ2檢驗;n<40或T<1時用χ2檢驗的確切機率法[15]。②t檢驗誤用於多組資料的比較。在醫學期刊中常會出現將t檢驗誤用於多組資料的比較。多組資料的比較應該採用方差分析(F檢驗),當差異具有統計學意義時,再進一步作兩兩比較。當各組均與一個對照組比較時採用Dunnettt檢驗;當各組相互迴圈比較時,則常採用Student-Newman-keuls(SNK)檢驗,又稱q檢驗[16]。③配對t檢驗與成組t檢驗誤用。大部分論文只註明採用t檢驗,而未註明是配對t檢驗還是成組t檢驗。配對t檢驗常用於處理前後的自身對照,即差值均數與總體均數“0”的比較;成組t檢驗適用於成正態分佈的兩個小樣本均數間的比較。④資料不呈正態分佈時未用非引數檢驗。t檢驗F檢驗等適用於呈正態分佈、方差齊且有確切的測量數值的資料,而非引數檢驗(如符號檢驗、秩和檢驗Wilcoxon法、秩檢驗-KruskalWallis法、Friedman法、Ridit分析、Seperman相關等)對資料無特殊要求,對按大小順序、評分、等級、反應程度甚至色調深淺等資料都可進行分析比較[17-18]。因此,對於多組計量資料的比較,呈正態分佈且方差齊時用F檢驗,方差不齊時可用變數變換,或採用秩和檢驗;對於兩個小樣本均數的比較或處理前後的比較,方差齊時用成組t檢驗或配對t檢驗，方差不齊時用t′檢驗[19]。

　　3結果解釋時存在的問題

　　統計分析的結果是推翻無效假設或是不能推翻無效假設。無效假設在一般的統計檢驗為兩組總體引數相等。推翻無效假設只能說兩組總體引數不相等而並不能說兩組相差很大。兩組相差如何要對可信區間進行研究觀察後得出。由於統計檢驗不能得出差別的大小,因而結論不能說“有明顯差異”或“有顯著差異”,也不能說“差異非常顯著”,更不能說“差異明顯”。在國外的統計書籍上的英語表達為“significant”,它的正確意義應當是“有意義的、有重要性的”。俄語為“Значмый”和日語中的“有意”也是這個意思。國內只有極個別的英漢詞典把“significant”誤譯為“顯著的”。正確的說法應當是“差異有統計學意義”或“差異有高度統計學意義”等[20]。在解釋差別有統計學意義的結果時，有些人常常根據P值的大小作出對實驗效應差別程度不同的專業結論[21]。例如某實驗研究，比較甲、乙兩種治療方法對某病的治療效果(假定甲法的療效優於乙法)，若得到“P<0.001”，則認為甲法極顯著優於乙法;若得到“P<0.01”，則認為甲法非常顯著優於乙法;若得到“P<0.05”，則認為甲法顯著優於乙法。犯這種錯誤的原因是錯誤的理解了統計學中P值的概念[7]。統計學上根據假設檢驗原理推算出來的P值表示拒絕特定的無效假設可能犯假陽性錯誤的機率。P值的大小並非指差異的太小，只能反映兩者相同或不相同。P值越小，說明越有理由認為兩種處理方法效果不同，而不能反映對比的兩組或多組之間差異的大小。差異的大小隻能根據專業知識來確定。此外，甚至在部分投稿文章中未交代所採用的.統計分析方法，也未見應用統計學的跡象，僅從各組資料的均數大小做出了統計推斷。醫學期刊論文中暴露出來的統計學錯誤，從表面上看是編輯部和審稿者把關不嚴所致。事實上，即使審稿時發現了上述錯誤，也無法改正。因為實驗設計的錯誤只有在科研工作開始之前才有可能得到糾正。即使編輯工作者能夠阻止有嚴重統計學問題的論文發表，也僅僅是治標而已。如何使廣大醫學論文作者在醫學研究中正確應用統計學，提高科研質量才是治本[7]。

　　4對策與建議

　　眾所周知，統計學是從事科學研究不可缺少的工具。從試驗設計、資料收集與表達、資料處理和結果分析，每一個環節都需要正確地運用統計知識，才能真正發揮統計學在科學研究中應起的作用。然而，在已出版和發表的一些學術專著和論文中、透過評審的科研成果和答辯的學位論文中，經常可以看到忽視、輕視和誤用統計學的現象[22]。

　　4.1提高編輯人員的統計學知識

　　應完善編輯人員的知識結構,保證統計學應用的準確性。為此,可定期聘請統計學專家對審稿人員進行統計學知識培訓。科技期刊的群體效應理論[23]認為,期刊編輯的專業結構應多元化,以利於編輯互相學習,實現知識互補。醫學期刊編輯部可考慮聘用統計學專業的研究生作為編輯。編輯應將醫學統計學作為自己的必修課,透過多種方式,如自學自修,參加講座或培訓班學習統計學知識,有條件的編輯部,如醫學院校學報編輯部,可以有計劃地組織編輯參加本科生或研究生醫學統計學課程的學習,也可鼓勵編輯人員在職攻讀統計學專業研究生學位。這樣,可以提高全體編輯人員的統計學水平,最終使編輯和審稿人都能夠發現論文中存在的統計學錯誤,並指導作者修改,正確進行醫學論文中有關統計學分析的描述[24]。另外，有關職能部門或學會可組織與醫學統計學相關的培訓班,聘請統計學專家講課,對編輯人員進行定期統計學知識培訓,加強科研設計、統計學知識的學習[19]。

　　4.2加強醫學統計學專家審稿

　　醫學研究論文專業性強,經常涉及統計學處理問題,有時會遇到統計方法複雜的稿件,這不僅需要本學科專家審稿,而且需要醫學統計專家把關,只有這樣,才能保證論文所報道的研究成果的真實性和可靠性。醫學期刊編委會中應有統計學專家,專門負責稿件統計學方面的審查工作。

　　4.3強化作者的統計學意識

　　目前,我國醫學科研工作者對統計學的重視不夠,沒有認識到統計學的重要性。因此,要加強宣傳,提高醫學科研人員對統計學重要性的認識,強化他們的統計學意識,務必在科研工作中和撰寫論文時做到正確應用統計學。另外,還可以對作者開辦有關科研論文撰寫知識的培訓班,面向臨床醫生,特別是年輕醫生定期培訓。請有研究經驗的專家講授科研課題的設計方法、如何正確運用統計學方法等。這些措施有利於強化作者的統計學意識,並樹立其精品意識,有利於增加優質稿源,從而提高期刊學術質量[19]。

　　總之,提高醫學期刊中統計學應用的質量是一項長期而又艱鉅的工作,它涉及到作者、編者、審者及讀者等多個方面,需要大家共同努力,才能逐步減少以至消除統計學誤用現象,從而提高醫學論文的科學性

　　本科生統計學畢業論文

　　體育統計學作為一門關於實踐活動調查的科學理論與方法，並不侷限在體育教學和體育研究中，而對其它的非體育行業也具有同樣的效用。分析當前學生對其的態度不難看出，學生對該門課程的認識並不清楚，且傳統教學模式的教學內容的限制下，並沒有結合當前時代的發展而做出相應的改變。因此，對其進行改革，使之完全能夠完全符合當今時代的發展。如，在教學過程中，教師要擴大自身的視野，對教學內容進行深化，不能將思想侷限在體育教學與運動訓練，並根據學生多元化的去向豐富教學內容。體育統計課程並非是一門一成不變的課程，其也可以變成學生喜歡的課程。如：明確體育統計學的價值作用和應用範圍，在教學活動過程中透過列舉一些有價值的具體事例，糾正學生的錯誤認識，改變學生的學習態度。其次，指導學生進行EXCEL表格的操作，對統計資料進行錄入、整理、分析以及輸出相關的圖表，從而掌握基本的操作;最後，將在體育統計學中學到的知識和技能在畢業論文中展現出來。從而讓學生透過理論與實踐的結合，掌握該課程的知識與技能，進而保障其日後運用中具備基本的能力。此外，該方法的使用，還要保證在教學內容與教學模式上進行相應的革新與改變.

　　2體育統計學教學的內容改革

　　在體統計學的教學過程中，要讓學生明確的認識到，體育統計學的使用並不侷限在體育教育工作與體育訓練研究工作當中。因此，在體育統計教學的內容改革，要對其授課的作出相應的改變和革新。首先，體育教材在的原理與知識介紹上比較簡單，且不具備系統性，學生難以對該課程進行透徹的瞭解。以課本中的樣本自由度與總體自由度的關係為例子。如果知識的講解不具體，學生難以理解總體標準差與樣本標準差的關係，從而打擊學生的學習積極性。根據實際情況對教學內容進行適當的安排，在對引數估計與統計推斷的例題講解中，適當的插入一章關於抽樣分佈的統計學基礎知識課，結合此基礎，再講授有關引數估計與統計推斷的知識。學生對抽樣分佈知識與原理得到了較好的理解，也為引數估計與統計推斷的具體應用打好了基礎。其次，在知識、內容及其結構的編排上並不合理，一些陳舊的知識還在繼續應用。雖然，近年來版本不斷的更新，但是教學的內容並未發生過大的改變。其知識的教授主要還是集中在體育教育領域，而忽略了統計學知識的系統性。再則傳統教學模式下忽視了學科知識的應用，在應用型操作技能的培養與訓練上也併為提升到一定的高度。在統計學內引入新的計算機操作知識，延伸學生學習該門課程的技術能力。如引入資料的圖表製作教學，Excel軟體中相關統計函式命令的操作性知識;如何利用Excel軟體進行資料的錄入、轉換、審查等知識等。最後，該教材在內容難度的把握上偏難，從而影響了學生的學習積極性。以該書的第十章類聚分析為例，這一片篇章的內容已經超過了該階段學生能接受的難度。此外，相關資料也表明，該階段教授這些知識的學校少之又少。且該教材在很多的高等院校中作為必修課程的教材。但其內容已經完全超過了本科生能接受的難度範圍，因此，在教材的改革方面應該重新編寫適宜本科階段體育統計學，進行基礎性知識的教育教學。

　　3體育統計學教學模式的改革實踐

　　當前，大多數的本科體育專業學生的教學模式還停留在傳統的教學模式上，典型的就是老師在講臺上講授，學生在課堂下邊聽講，課後進行練習鞏固。而該教學模式的直接結果就是學生的填鴨式教學。缺乏對該課程的真實認識，且在練習鞏固的過程中也不需要進行資料的統計分析，也就決定了其無法勝任科研活動的研究。尤其是當前大學生的對掛科與不掛科的態度，決定了學生學習該門課程的態度。因此，教育者在本科教學過程中，要不斷的思考並進行相關教學的改革實踐，其當前改革的成效大多集中在：透過畢業論文檢驗學生對該門課程的學習程度，以及在教學過程中引入計算機知識，培養學生的實踐能力。在筆者看來，實現體育統計學教學模式的改革實踐，可以從以下幾個方面入手：首先將傳統教學方法與一次性嵌入教學相結合，一人一臺電腦進行EXCEL軟體的操作，進行資料的輸入、編輯、修飾以及資料圖表的輸出，並使用Excel內常用的統計命令使用、根據相關原始資料進行t統計學知識運用的基本操作，將教師的講授與學生的上機操作結合起來，提高學生的學習積極性，改善教學模式，實現教學目標。

　　4結語

　　對體育統計學進行改革，使之能夠適應當前社會的發展，進而為學生日後的工作提供切實可行的幫助，發揮效用與價值。推動我國體育教育事業的發展，並滿足當前社會對體育表現形式多樣化的需求。

【本科生統計學畢業論文】相關文章：