1.計量資料的統(tǒng)計方法
分析計量資料的統(tǒng)計分析方法可分為參數(shù)檢驗(yàn)法和非參數(shù)檢驗(yàn)法。
參數(shù)檢驗(yàn)法主要為t檢驗(yàn)和方差分析(ANOVN,即F檢驗(yàn))等,兩組間均數(shù)比較時常用t檢驗(yàn)和u檢驗(yàn),兩組以上均數(shù)比較時常用方差分析;非參數(shù)檢驗(yàn)法主要包括秩和檢驗(yàn)等。t檢驗(yàn)可分為單組設(shè)計資料的t檢驗(yàn)、配對設(shè)計資料的t檢驗(yàn)和成組設(shè)計資料的t檢驗(yàn);當(dāng)兩個小樣本比較時要求兩總體分布為正態(tài)分布且方差齊性,若不能滿足以上要求,宜用t 檢驗(yàn)或非參數(shù)方法(秩和檢驗(yàn))。方差分析可用于兩個以上樣本均數(shù)的比較,應(yīng)用該方法時,要求各個樣本是相互獨(dú)立的隨機(jī)樣本,各樣本來自正態(tài)總體且各處理組總體方差齊性。根據(jù)設(shè)計類型不同,方差分析中又包含了多種不同的方法。對于定量資料,應(yīng)根據(jù)所采用的設(shè)計類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計分析方法,不應(yīng)盲目套用t檢驗(yàn)和單因素方差分析。
2.計數(shù)資料的統(tǒng)計方法
計數(shù)資料的統(tǒng)計方法主要針對四格表和R*C表利用檢驗(yàn)進(jìn)行分析。 四格表資料:組間比較用
檢驗(yàn)或u檢驗(yàn),若不能滿足 檢驗(yàn):當(dāng)計數(shù)資料呈配對設(shè)計時,獲得的四格表為配對四格表,其用到的檢驗(yàn)公式和校正公式可參考書籍。 R*C表可以分為雙向無序,單向有序、雙向有序?qū)傩韵嗤碗p向有序?qū)傩圆煌念悾煌惖男辛斜砀鶕?jù)其研究目的,其選擇的方法也不一樣。
3.等級資料的統(tǒng)計方法
等級資料(有序變量)是對性質(zhì)和類別的等級進(jìn)行分組,再清點(diǎn)每組觀察單位個數(shù)所得到的資料。在臨床醫(yī)學(xué)資料中,常遇到一些定性指標(biāo),如臨床療效的評價、疾病的臨床分期、病癥嚴(yán)重程度的臨床分級等,對這些指標(biāo)常采用分成若干個等級然后分類計數(shù)的辦法來解決它的量化問題,這樣的資料統(tǒng)計上稱為等級資料。
統(tǒng)計方法是指有關(guān)收集、整理、分析和解釋統(tǒng)計數(shù)據(jù),并對其所反映的問題作出一定結(jié)論的方法。統(tǒng)計方法是一種從微觀結(jié)構(gòu)上來研究物質(zhì)的宏觀性質(zhì)及其規(guī)律的獨(dú)特的方法。
定義1
所謂統(tǒng)計方法是指用多次測量值采用一定方法計算出的標(biāo)準(zhǔn)不確定度。不同于A類的其它方法計算者稱為B類標(biāo)準(zhǔn)不確定度或稱為標(biāo)準(zhǔn)不確定度的B類計算法(typeBevaluation)。
定義2
在平均離子模型的基礎(chǔ)上,發(fā)展了一個計算離子組態(tài)概率分布的有效方法,稱為統(tǒng)計方法。
源自: 激光等離子體非平衡X射線發(fā)射譜理論研究《物理學(xué)報》1995年 裴文兵,常鐵強(qiáng),張鈞
定義3
統(tǒng)計方法是指在不知道紋理基元或尚未監(jiān)測出基元的情況下進(jìn)行紋理分析,主要描述紋理基元或局部模式隨機(jī)和空間統(tǒng)計特征,如灰度共生矩陣法、隨機(jī)場模型法等。
源自: 利用紋理分析方法提取TM圖像信息《遙感學(xué)報》2004年 姜青香,劉慧平
定義4
分子物理學(xué)就是用統(tǒng)計方法來研究的。大量個別的偶然事件存在著一定的規(guī)律,表現(xiàn)了這些事件的整體的本質(zhì)和必然的聯(lián)系。這種規(guī)律是客觀存在的,統(tǒng)計的方法則是揭示這種規(guī)律的必要手段。統(tǒng)計方法只能適合于大量事件,研究的事件越多,得到的統(tǒng)計結(jié)果也越準(zhǔn)確
1.墓于粗糙集( Rough Set)理論的約簡方法 粗糙集理論是一種研究不精確、不確定性知識的數(shù)學(xué)工具。
目前受到了KDD的廣泛重視,利用粗糙集理論對數(shù)據(jù)進(jìn)行處理是一種十分有效的精簡數(shù)據(jù)維數(shù)的方法。我們所處理的數(shù)據(jù)一般存在信息的含糊性(Vagueness)問題。
含糊性有三種:術(shù)語的模糊性,如高矮;數(shù)據(jù)的不確定性,如噪聲引起的;知識自身的不確定性,如規(guī)則的前后件間的依賴關(guān)系并不是完全可靠的。在KDD中,對不確定數(shù)據(jù)和噪聲干擾的處理是粗糙集方法的 2.基于概念樹的數(shù)據(jù)濃縮方法 在數(shù)據(jù)庫中,許多屬性都是可以進(jìn)行數(shù)據(jù)歸類,各屬性值和概念依據(jù)抽象程度不同可以構(gòu)成一個層次結(jié)構(gòu),概念的這種層次結(jié)構(gòu)通常稱為概念樹。
概念樹一般由領(lǐng)域?qū)<姨峁?,它將各個層次的概念按一般到特殊的順序排列。 3.信息論思想和普化知識發(fā)現(xiàn) 特征知識和分類知識是普化知識的兩種主要形式,其算法基本上可以分為兩類:數(shù)據(jù)立方方法和面向?qū)傩詺w納方法。
普通的基于面向?qū)傩詺w納方法在歸納屬性的選擇上有一定的盲目性,在歸納過程中,當(dāng)供選擇的可歸納屬性有多個時,通常是隨機(jī)選取一個進(jìn)行歸納。事實(shí)上,不同的屬性歸納次序獲得的結(jié)果知識可能是不同的,根據(jù)信息論最大墑的概念,應(yīng)該選用一個信息丟失最小的歸納次序。
4.基于統(tǒng)計分析的屬性選取方法 我們可以采用統(tǒng)計分析中的一些算法來進(jìn)行特征屬性的選取,比如主成分分析、逐步回歸分析、公共因素模型分析等。這些方法的共同特征是,用少量的特征元組去描述高維的原始知識基。
5.遺傳算法〔GA, Genetic Algo}thrn}) 遺傳算法是一種基于生物進(jìn)化論和分子遺傳學(xué)的全局隨機(jī)搜索算法。遺傳算法的基本思想是:將問題的可能解按某種形式進(jìn)行編碼,形成染色體。
隨機(jī)選取N個染色體構(gòu)成初始種群。再根據(jù)預(yù)定的評價函數(shù)對每個染色體計算適應(yīng)值。
選擇適應(yīng)值高的染色體進(jìn)行復(fù)制,通過遺傳運(yùn)算(選擇、交叉、變異)來產(chǎn)生一群新的更適應(yīng)環(huán)境的染色體,形成新的種群。這樣一代一代不斷繁殖進(jìn)化,最后收斂到一個最適合環(huán)境的個體上,從而求得問題的最優(yōu)解。
遺傳算法應(yīng)用的關(guān)鍵是適應(yīng)度函數(shù)的建立和染色體的描述。在實(shí)際應(yīng)用中,通常將它和神經(jīng)網(wǎng)絡(luò)方法綜合使用。
通過遺傳算法來搜尋出更重要的變量組合。
統(tǒng)計數(shù)據(jù)的具體搜集方法有:
訪問調(diào)查。訪問調(diào)查又稱派員調(diào)查,它是調(diào)查者與被調(diào)查者通過面對面地交談從而得到所需資料的調(diào)查方法。訪問調(diào)查的方式有標(biāo)準(zhǔn)式訪問和非標(biāo)準(zhǔn)式訪問兩種。前者是按一個事先設(shè)計好的訪問結(jié)構(gòu),如固定格式的標(biāo)準(zhǔn)化問卷,有順序地依次提問,并由受訪者做出回答。非標(biāo)準(zhǔn)式訪問則事先不做統(tǒng)一的問卷或表格,也沒有統(tǒng)一的提問順序,有的只是一個題目或提綱,由調(diào)查人員和受訪者自由交談,以獲得所需的資料。
郵寄調(diào)查。它是通過郵寄或宣傳媒體等方式將調(diào)查表或調(diào)查問卷送至被調(diào)查者手中,由被調(diào)查者填寫,然后將調(diào)查表寄回或投放到指定收集點(diǎn)的一種調(diào)查方法。
電話調(diào)查。電話調(diào)查是調(diào)查人員利用電話同受訪者進(jìn)行語言交流,從而獲得信息的一種調(diào)查方式。電話調(diào)查具有時效快、費(fèi)用低等特點(diǎn)。
電腦輔助調(diào)查。它也稱電腦輔助電話調(diào)查系統(tǒng)(computer-assisted telephone interviewing system,cati)。該系統(tǒng)使電話調(diào)查更加便利和快捷,也使調(diào)查的質(zhì)量大大提高了。
座談會。它也稱為集體訪談法,它是將一組被調(diào)查者集中在調(diào)查現(xiàn)場,讓他們對調(diào)查的主題(如一種產(chǎn)品、一項(xiàng)服務(wù)或其他話題)發(fā)表意見,從而獲取調(diào)查資料的方法。
個別深度訪問。它是一種一次只有一名受訪者參加的特殊的定性研究。“深訪”是一種無結(jié)構(gòu)的個人訪問,調(diào)查人員運(yùn)用大量的追問技巧,盡可能讓受訪者自由發(fā)揮,表達(dá)他的想法和感受。
觀察法。它是指就調(diào)查對象的行動和意識,調(diào)查人員邊觀察邊記錄以收集信息的方法。
實(shí)驗(yàn)法。它是一種特殊的觀察調(diào)查方法,它是在所設(shè)定的特殊實(shí)驗(yàn)場所、特殊狀態(tài)下,對調(diào)查對象進(jìn)行實(shí)驗(yàn)以取得所需資料的一種調(diào)查方法。
其中前六種方法屬于詢問調(diào)查,后兩種方法屬于觀察與實(shí)驗(yàn)的方法。
統(tǒng)計整理的內(nèi)容通常包括:
1、根據(jù)研究任務(wù)的要求,選擇應(yīng)整理的指標(biāo),并根據(jù)分析的需要確定具體的分組;
2、對統(tǒng)計資料進(jìn)行匯總、計算;
3、通過統(tǒng)計表描述匯總的結(jié)果。在統(tǒng)計整理中,抓住最基本的、最能說明問題本質(zhì)特征的統(tǒng)計分組和統(tǒng)計指標(biāo)對統(tǒng)計資料進(jìn)行加工整理,這是進(jìn)行統(tǒng)計整理必須遵循的原則。
統(tǒng)計整理:
統(tǒng)計整理即“統(tǒng)計資料整理”,就是根據(jù)研究的目的和任務(wù)的要求,對統(tǒng)計調(diào)查所搜集到的原始資料進(jìn)行科學(xué)的加工整理,使之條理化、系統(tǒng)化,把反映總體單位的大量原始資料,轉(zhuǎn)化為反映總體的基本統(tǒng)計指標(biāo),統(tǒng)計工作的這一過程,叫統(tǒng)計資料的整理。廣義地說,統(tǒng)計整理也包括對次級資料進(jìn)行的再加工。
描述統(tǒng)計是指對采集的數(shù)據(jù)進(jìn)行登記、審核、整理、歸類,在此基礎(chǔ)上進(jìn)一步計算出各種能反映總體數(shù)量特征的綜合指標(biāo),并用圖表的形式表示經(jīng)過歸納分析而得到的各種有用的統(tǒng)計信息。
推斷統(tǒng)計是在對樣本數(shù)據(jù)進(jìn)行描述的基礎(chǔ)上,利用一定的方法根據(jù)樣本數(shù)據(jù)去估計或檢驗(yàn)總體的數(shù)量特征。推斷統(tǒng)計是現(xiàn)代統(tǒng)計學(xué)的主要內(nèi)容。
回歸分析:確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法 方差分析:用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗(yàn),通過分析研究中不同來源的變異對總變異的貢獻(xiàn)大小,從而確定可控因素對研究結(jié)果影響力的大小。 相關(guān)分析:是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。
相關(guān)分析與回歸分析在實(shí)際應(yīng)用中有密切關(guān)系。然而在回歸分析中,所關(guān)心的是一個隨機(jī)變量Y對另一個(或一組)隨機(jī)變量X的依賴關(guān)系的函數(shù)形式。
而在相關(guān)分析中 ,所討論的變量的地位一樣,分析側(cè)重于隨機(jī)變量之間的種種相關(guān)特征。 判別分析:是按照一定的判別準(zhǔn)則,建立一個或多個判別函數(shù),用研究對象的大量資料確定判別函數(shù)中的待定系數(shù),并計算判別指標(biāo),在氣候分類、農(nóng)業(yè)區(qū)劃、土地類型劃分中有著廣泛的應(yīng)用。
聚類分析:通過數(shù)據(jù)建模簡化數(shù)據(jù)的一種方法,聚類分析在電子商務(wù)中網(wǎng)站建設(shè)數(shù)據(jù)挖掘中也是很重要的一個方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,可以更好的幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。 因子分析:基本目的就是用少數(shù)幾個因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子(之所以稱其為因子,是因?yàn)樗遣豢捎^測的,即不是具體的變量),以較少的幾個因子反映原資料的大部分信息。
運(yùn)用這種研究技術(shù),可以方便地找出影響消費(fèi)者購買、消費(fèi)以及滿意度的主要因素是哪些,以及它們的影響力(權(quán)重)運(yùn)用這種研究技術(shù),還可以為市場細(xì)分做前期分析。 描述統(tǒng)計是通過圖表或數(shù)學(xué)方法,對數(shù)據(jù)資料進(jìn)行整理、分析,并對數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機(jī)變量之間關(guān)系進(jìn)行估計和描述的方法。
描述統(tǒng)計分為集中趨勢分析和離中趨勢分析和相關(guān)分析三大部分。常見統(tǒng)計分析法:t檢驗(yàn),F(xiàn)檢驗(yàn) 方差分析。
聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:2.705秒