收集方法
1、調(diào)查法
調(diào)查方法一般分為普查和抽樣調(diào)查兩大類。
2、觀察法
主要包括兩個方面:一是對人的行為的觀察,二是對客觀事物的觀察。觀察法應(yīng)用很廣泛,常和詢問法、搜集實(shí)物結(jié)合使用,以提高所收集信息的可靠性。
3、實(shí)驗(yàn)方法
實(shí)驗(yàn)方法能通過實(shí)驗(yàn)過程獲取其他手段難以獲得的信息或結(jié)論。
實(shí)驗(yàn)方法也有多種形式,如實(shí)驗(yàn)室實(shí)驗(yàn)、現(xiàn)場實(shí)驗(yàn)、計(jì)算機(jī)模擬實(shí)驗(yàn)、計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境下人機(jī)結(jié)合實(shí)驗(yàn)等。現(xiàn)代管理科學(xué)中新興的管理實(shí)驗(yàn),現(xiàn)代經(jīng)濟(jì)學(xué)中正在形成的實(shí)驗(yàn)經(jīng)濟(jì)學(xué)中的經(jīng)濟(jì)實(shí)驗(yàn),實(shí)質(zhì)上就是通過實(shí)驗(yàn)獲取與管理或經(jīng)濟(jì)相關(guān)的信息。
4、文獻(xiàn)檢索
文獻(xiàn)檢索就是從浩繁的文獻(xiàn)中檢索出所需的信息的過程。文獻(xiàn)檢索分為手工檢索和計(jì)算機(jī)檢索。
5、網(wǎng)絡(luò)信息收集
網(wǎng)絡(luò)信息是指通過計(jì)算機(jī)網(wǎng)絡(luò)發(fā)布、傳遞和存儲的各種信息。收集網(wǎng)絡(luò)信息的最終目標(biāo)是給廣大用戶提供網(wǎng)絡(luò)信息資源服務(wù),整個過程經(jīng)過網(wǎng)絡(luò)信息搜索、整合、保存和服務(wù)四個步驟,
參考資料來源:搜狗百科-信息收集
業(yè)務(wù)上
1.業(yè)務(wù)為核心,數(shù)據(jù)為王
了解整個產(chǎn)業(yè)鏈的結(jié)構(gòu)
制定好業(yè)務(wù)的發(fā)展規(guī)劃
了解衡量的核心指標(biāo)
有了數(shù)據(jù)必須和業(yè)務(wù)結(jié)合才有效果
需要懂業(yè)務(wù)的整體概況,摸清楚所在產(chǎn)業(yè)鏈的整個結(jié)構(gòu),對行業(yè)的上游和下游的經(jīng)營情況有大致的了解。然后根據(jù)業(yè)務(wù)當(dāng)前的需要,指定發(fā)展計(jì)劃,從而歸類出需要整理的數(shù)據(jù)。最后一步詳細(xì)的列出數(shù)據(jù)核心指標(biāo)(KPI),并且對幾個核心指標(biāo)進(jìn)行更細(xì)致的拆解,當(dāng)然具體結(jié)合你的業(yè)務(wù)屬性來處理,找出那些對指標(biāo)影響幅度較大的影響因子。前期資料的收集以及業(yè)務(wù)現(xiàn)況的全面掌握非常關(guān)鍵。
2.思考指標(biāo)現(xiàn)狀,發(fā)現(xiàn)多維規(guī)律
熟悉產(chǎn)品框架,全面定義每個指標(biāo)的運(yùn)營現(xiàn)狀對
比同行業(yè)指標(biāo),挖掘隱藏的提升空間
拆解關(guān)鍵指標(biāo),合理設(shè)置運(yùn)營方法來觀察效果
爭對核心用戶,單獨(dú)進(jìn)行產(chǎn)品用研與需求挖掘
業(yè)務(wù)的分析大多是定性的,需要培養(yǎng)一種客觀的感覺意識。定性的分析則需要借助技術(shù)、工具、機(jī)器。而感覺的培養(yǎng),由于每個人的思維、感知都不同,只能把控大體的方向,很多數(shù)據(jù)元素之間的關(guān)系還是需要通過數(shù)據(jù)可視化技術(shù)來實(shí)現(xiàn)。
3.規(guī)律驗(yàn)證,經(jīng)驗(yàn)總結(jié)
發(fā)現(xiàn)了規(guī)律之后不能立刻上線,需要在測試機(jī)上對模型進(jìn)行驗(yàn)證。
技能上
1.Excel是否精鉆?
除了常用的Excel函數(shù)(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel圖表(餅圖、線圖、柱形圖、雷達(dá)圖等)和簡單分析技能也是經(jīng)常用的,可以幫助你快速分析業(yè)務(wù)走勢和異常情況;另外,Excel里面的函數(shù)結(jié)合透視表以及VBA功能是完善報(bào)表開發(fā)的利器,讓你一鍵輕松搞定報(bào)表。
2.你需要更懂?dāng)?shù)據(jù)庫
常用的數(shù)據(jù)庫如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL語句的熟練使用,對于數(shù)據(jù)庫的存儲讀取過程也要熟練掌握。在對于大數(shù)據(jù)量處理時,如何想辦法加快程序的運(yùn)行速度、減少網(wǎng)絡(luò)流量、提高數(shù)據(jù)庫的安全性是非常有必要的。
3.掌握數(shù)據(jù)整理、可視化和報(bào)表制作
數(shù)據(jù)整理,是將原始數(shù)據(jù)轉(zhuǎn)換成方便實(shí)用的格式,Excel在協(xié)同工作上并不是一個好工具,報(bào)表FineReport比較推薦。項(xiàng)目部署的Tableau、FineBI、Qlikview一類BI工具,有沒有好好培訓(xùn)學(xué)習(xí),這些便捷的工具都能淡化數(shù)據(jù)分析時一些重復(fù)性操作,把精力更多留于分析。
試讀結(jié)束,如需閱讀或下載,請點(diǎn)擊購買>
原發(fā)布者:陽夏秋天
數(shù)據(jù)中心數(shù)據(jù)管理方案1、公司現(xiàn)有數(shù)據(jù)現(xiàn)狀現(xiàn)公司主要的大數(shù)據(jù)容量的主要為公司的航片數(shù)據(jù)和衛(wèi)片數(shù)據(jù)、警用調(diào)查成果的照片數(shù)據(jù),以及用來做調(diào)查的大比例尺地形圖數(shù)據(jù),目前公司勘測、數(shù)據(jù)、軟件部門加起來大概50T的容量??紤]到以后的擴(kuò)展和數(shù)據(jù)備份,數(shù)據(jù)中心此次預(yù)計(jì)100T的容量進(jìn)行數(shù)據(jù)管理。針對這種大容量數(shù)據(jù)管理有三種解決方案:1、支持大容量的存儲+磁帶庫備份2、多個NAS級存儲3、購買大量1T和2T的硬盤(一份存儲+一份備份)+行之有效的數(shù)據(jù)進(jìn)出及保存制度。前段時間與公司領(lǐng)導(dǎo)從管理的方便性、投入的成本等各方面考慮討論的結(jié)果來看,決定采用第三種解決方案——用大容量硬盤進(jìn)行管理。2、硬盤購買的數(shù)量及總價存儲100T左右的數(shù)據(jù),可以采購1T或2T的硬盤進(jìn)行存儲(1T的硬盤相對比較穩(wěn)定)。選購硬盤時需考慮到硬盤的轉(zhuǎn)速、硬盤的緩存容量、硬盤的平均尋道時間、硬盤的功耗以及硬盤的價格。單碟容量是目前硬盤發(fā)展的重點(diǎn),幾乎就是決定硬盤檔次的標(biāo)準(zhǔn),目前盤片數(shù)量最多為5張,在盤片數(shù)無法增加的情況下,提升單碟容量是提升硬盤容量的唯一辦法。所以,我們在購買硬盤的時候,選擇采用垂直記錄技術(shù)的產(chǎn)品,在性能方面表現(xiàn)更出色。緩存就作為硬盤中的一個緩沖的區(qū)域,調(diào)節(jié)兩者之間的數(shù)據(jù)傳輸,緩存的大小直接影響到硬盤的性能,緩存區(qū)域越大數(shù)據(jù)的穩(wěn)定性就越好,自然數(shù)據(jù)等待時間也就越短,一般反應(yīng)到實(shí)際操作中就是運(yùn)行速度越快。轉(zhuǎn)速是影響硬盤性能的主要因素,目前主流硬盤都采用了
業(yè)務(wù)上1.業(yè)務(wù)為核心,數(shù)據(jù)為王了解整個產(chǎn)業(yè)鏈的結(jié)構(gòu)制定好業(yè)務(wù)的發(fā)展規(guī)劃了解衡量的核心指標(biāo)有了數(shù)據(jù)必須和業(yè)務(wù)結(jié)合才有效果需要懂業(yè)務(wù)的整體概況,摸清楚所在產(chǎn)業(yè)鏈的整個結(jié)構(gòu),對行業(yè)的上游和下游的經(jīng)營情況有大致的了解。
然后根據(jù)業(yè)務(wù)當(dāng)前的需要,指定發(fā)展計(jì)劃,從而歸類出需要整理的數(shù)據(jù)。最后一步詳細(xì)的列出數(shù)據(jù)核心指標(biāo)(KPI),并且對幾個核心指標(biāo)進(jìn)行更細(xì)致的拆解,當(dāng)然具體結(jié)合你的業(yè)務(wù)屬性來處理,找出那些對指標(biāo)影響幅度較大的影響因子。
前期資料的收集以及業(yè)務(wù)現(xiàn)況的全面掌握非常關(guān)鍵。2.思考指標(biāo)現(xiàn)狀,發(fā)現(xiàn)多維規(guī)律熟悉產(chǎn)品框架,全面定義每個指標(biāo)的運(yùn)營現(xiàn)狀對比同行業(yè)指標(biāo),挖掘隱藏的提升空間拆解關(guān)鍵指標(biāo),合理設(shè)置運(yùn)營方法來觀察效果爭對核心用戶,單獨(dú)進(jìn)行產(chǎn)品用研與需求挖掘業(yè)務(wù)的分析大多是定性的,需要培養(yǎng)一種客觀的感覺意識。
定性的分析則需要借助技術(shù)、工具、機(jī)器。而感覺的培養(yǎng),由于每個人的思維、感知都不同,只能把控大體的方向,很多數(shù)據(jù)元素之間的關(guān)系還是需要通過數(shù)據(jù)可視化技術(shù)來實(shí)現(xiàn)。
3.規(guī)律驗(yàn)證,經(jīng)驗(yàn)總結(jié)發(fā)現(xiàn)了規(guī)律之后不能立刻上線,需要在測試機(jī)上對模型進(jìn)行驗(yàn)證。技能上1.Excel是否精鉆?除了常用的Excel函數(shù)(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel圖表(餅圖、線圖、柱形圖、雷達(dá)圖等)和簡單分析技能也是經(jīng)常用的,可以幫助你快速分析業(yè)務(wù)走勢和異常情況;另外,Excel里面的函數(shù)結(jié)合透視表以及VBA功能是完善報(bào)表開發(fā)的利器,讓你一鍵輕松搞定報(bào)表。
2.你需要更懂?dāng)?shù)據(jù)庫常用的數(shù)據(jù)庫如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL語句的熟練使用,對于數(shù)據(jù)庫的存儲讀取過程也要熟練掌握。在對于大數(shù)據(jù)量處理時,如何想辦法加快程序的運(yùn)行速度、減少網(wǎng)絡(luò)流量、提高數(shù)據(jù)庫的安全性是非常有必要的。
3.掌握數(shù)據(jù)整理、可視化和報(bào)表制作數(shù)據(jù)整理,是將原始數(shù)據(jù)轉(zhuǎn)換成方便實(shí)用的格式,Excel在協(xié)同工作上并不是一個好工具,報(bào)表FineReport比較推薦。項(xiàng)目部署的Tableau、FineBI、Qlikview一類BI工具,有沒有好好培訓(xùn)學(xué)習(xí),這些便捷的工具都能淡化數(shù)據(jù)分析時一些重復(fù)性操作,把精力更多留于分析。
如何提高數(shù)據(jù)分析能力? (2012-02-19 16:19:19)轉(zhuǎn)載▼
標(biāo)簽: 數(shù)據(jù)分析 數(shù)據(jù)挖掘 雜談
作為一個合格的咨詢師,除了快速的學(xué)習(xí)能力和敏捷的分析能力,強(qiáng)大的數(shù)據(jù)分析能力也是必不可少的。筆者根據(jù)自己的經(jīng)驗(yàn),總結(jié)出以下幾個對提高數(shù)據(jù)分析能力有幫助的方法,以供參考。一、熟悉公司業(yè)務(wù) 首先要熟悉公司業(yè)務(wù)及流程。若脫離行業(yè)認(rèn)知和公司業(yè)務(wù)背景,分析的結(jié)果只會是脫了線的風(fēng)箏,沒有太大的實(shí)用價值。數(shù)據(jù)分析的最終目的是作為一種分析方法來為整個項(xiàng)目服務(wù)。二、明確分析目的 常常會有人問這些數(shù)據(jù)可以做什么分析?這是典型的“為了分析而分析”。數(shù)據(jù)分析的前提是先明確分析目的,這樣的分析才有意義;三、運(yùn)用營銷、管理等理論 營銷、管理等理論是數(shù)據(jù)分析的指導(dǎo)思想,使分析思路系統(tǒng)化。例如4P理論等,從哪幾個維度去分析?考慮哪幾個方面?只有這樣做才能使數(shù)據(jù)分析變得有血有肉有脈絡(luò),真正做到理論指導(dǎo)實(shí)踐;四、掌握有效數(shù)據(jù)分析方法 了解數(shù)據(jù)分析流程,掌握數(shù)據(jù)分析基本原理與方法,并靈活運(yùn)用到實(shí)踐工作中,不論簡單還是復(fù)雜的分析方法,只要能解決問題的方法就是好方法;五、玩轉(zhuǎn)數(shù)據(jù)分析工具 數(shù)據(jù)分析工具,建議先玩轉(zhuǎn)excel數(shù)據(jù)透視表,有興趣、實(shí)踐、需要的話,再學(xué)習(xí)SPSS、SAS等統(tǒng)計(jì)分析工具。同樣,只要能解決問題的工具就是好工具;六、學(xué)會用圖表說話,玩轉(zhuǎn)PPT等工具 學(xué)會如何用圖表有效展現(xiàn)分析結(jié)果,PPT有助于數(shù)據(jù)分析結(jié)果展現(xiàn),達(dá)人必備;水晶易表亦對分析結(jié)果的展現(xiàn)有很大幫助,選擇性使用;思維導(dǎo)圖可幫助理清分析思路,根據(jù)需要選用。光做數(shù)據(jù)分析是不夠的,真正要做的是將數(shù)據(jù)分析結(jié)果清晰地展現(xiàn)給其他人看;七、勤思考、多動手、多總結(jié) 需要經(jīng)常發(fā)問為什么是這樣的、為什么不是那樣的。只有這樣勤于思考才有突破點(diǎn); 光靠腦袋想是不夠的,需要多動手實(shí)踐,不要怕錯,大不了錯了重來,數(shù)據(jù)分析就是一個不斷假設(shè)、驗(yàn)證的過程; 不斷總結(jié)分析方法、分析思路、分析流程,在總結(jié)中前行;八、關(guān)注行業(yè)動態(tài) 關(guān)注數(shù)據(jù)分析行業(yè)動態(tài),積極地學(xué)習(xí)他人的數(shù)據(jù)分析經(jīng)驗(yàn);九、收藏幾本分析秘籍 可在家中收藏一些使用的分析工具書,以便隨時查閱,如《用圖表說話》、《excel圖表之道》等; 數(shù)據(jù)分析不僅是個工具,而且是門藝術(shù),希望能與大家共勉,提高自己的數(shù)據(jù)分析能力。
參照這個來提升自己。希望對你有所幫助
我以前收藏的,挺不錯:
1、存儲
將硬盤分成NTFS格式,NTFS比FAT32快,并看你的數(shù)據(jù)文件大小,1G以上你可以采用多數(shù)據(jù)庫文件,這樣可以將存取負(fù)載分散到多個物理硬盤或磁盤陣列上。
2、tempdb
tempdb也應(yīng)該被單獨(dú)的物理硬盤或磁盤陣列上,建議放在RAID 0上,這樣它的性能最高,不要對它設(shè)置最大值讓它自動增長
3、日志文件
日志文件也應(yīng)該和數(shù)據(jù)文件分開在不同的理硬盤或磁盤陣列上,這樣也可以提高硬盤I/O性能。
4、分區(qū)視圖
就是將你的數(shù)據(jù)水平分割在集群服務(wù)器上,它適合大規(guī)模OLTP,SQL群集上,如果你數(shù)據(jù)庫不是訪問特別大不建議使用。
5、簇索引
你的表一定有個簇索引,在使用簇索引查詢的時候,區(qū)塊查詢是最快的,如用between,應(yīng)為他是物理連續(xù)的,你應(yīng)該盡量減少對它的updaet,應(yīng)為這可以使它物理不連續(xù)。
6、非簇索引
非簇索引與物理順序無關(guān),設(shè)計(jì)它時必須有高度的可選擇性,可以提高查詢速度,但對表update的時候這些非簇索引會影響速度,且占用空間大,如果你愿意用空間和修改時間換取速度可以考慮。
7、索引視圖
如果在視圖上建立索引,那視圖的結(jié)果集就會被存儲起來,對與特定的查詢性能可以提高很多,但同樣對update語句時它也會嚴(yán)重減低性能,一般用在數(shù)據(jù)相對穩(wěn)定的數(shù)據(jù)倉庫中。
8、維護(hù)索引
你在將索引建好后,定期維護(hù)是很重要的,用dbcc showcontig來觀察頁密度、掃描密度等等,及時用dbcc indexdefrag來整理表或視圖的索引,在必要的時候用dbcc dbreindex來重建索引可以受到良好的效果。
不論你是用幾個表1、2、3點(diǎn)都可以提高一定的性能,5、6、8點(diǎn)你是必須做的,至于4、7點(diǎn)看你的需求。
表格的應(yīng)用 由于工作原因,經(jīng)常接觸到表格。
我們發(fā)現(xiàn),表格不但廣泛的運(yùn)用在各類數(shù)據(jù)收集和分析,同時通過表格這樣一種二維矩陣來整理和陳列信息時(即便最后的展示方式并非一個典型的表格樣式),能夠很好的表達(dá)信息之間的邏輯關(guān)系,易于幫助理解橫縱信息之間的關(guān)系。在實(shí)際的網(wǎng)頁設(shè)計(jì)應(yīng)用中,表格橫縱相互獨(dú)立又相互關(guān)聯(lián)的模式尤其適用于:1.組織和展示大量的信息 表格簡單的結(jié)構(gòu)不但能包含大量的信息,且同時保證信息的可讀性,便于讀者快速掃描信息、從大量的條目中找到所需的信息。
2.展示對比性信息 通過合理的布局,表格能清晰的展示出同類對比信息,便于讀者分辨不同條目信息之間的關(guān)聯(lián)和區(qū)別,從而關(guān)注到關(guān)鍵、問題條目??偟膩碚f,一個構(gòu)造清晰的表格布局,將大大提升讀者對信息的接收速度和理解程度。
例如下圖中蘋果官網(wǎng)對不同型號mac book的信息陳列方式,就采用了表格的結(jié)構(gòu),清晰的展示了4款不同的macbook,及各自的性能、售價等屬性,同時讀者第一眼就可以掃描到并理解表格結(jié)構(gòu),橫向是4款macbook的排列,縱向分別列出了各自的屬性,然后進(jìn)一步就可以根據(jù)自己的興趣點(diǎn)就4款macbook的不同屬性進(jìn)行對比,信息完整且便于掃描。如上所述,表格常用來展示大量的、對比性的信息,因此提高表格的可讀性、便于用戶快速掃描,是表格設(shè)計(jì)的關(guān)鍵。
本文僅就筆者閱讀過的幾篇關(guān)于表格設(shè)計(jì)的文章結(jié)合工作中的一些拙見,整理成文,分享如下。表格的要素 研究如何提高表格可讀性之前,我們先簡要闡述下表格的組成要素,這里我們暫且這么總結(jié):表格 = 標(biāo)題 + 表頭 + 行標(biāo)簽 + 單元格數(shù)據(jù)(信息),如下圖 表格標(biāo)題是對表格整體的描述,應(yīng)包含表格數(shù)據(jù)的來源及屬性,使讀者對表格內(nèi)容有所認(rèn)識,例如數(shù)據(jù)收集的日期、地區(qū)及其表格數(shù)據(jù)的其他屬性。
行標(biāo)簽和列標(biāo)簽(表頭) 是對本行/本列數(shù)據(jù)的描述,可以理解為是表格的骨架,是用戶快速掃描并接收表格布局的關(guān)鍵要素。單元格數(shù)據(jù)(單元格信息)這里就不在多說,是表格的主體內(nèi)容。
提高表格可讀性的一些技巧 1. 根據(jù)表格的用途,設(shè)計(jì)表格的布局 如下圖,兩張表格中所包含的數(shù)據(jù)完全相同,是關(guān)于10座山峰的高度和人類登頂年份數(shù)據(jù)。不同的是他們的成列方式:表1a根據(jù)山峰的高度排序陳列,而表1b則根據(jù)人類登頂山峰的年份排序陳列,一眼之下,這兩張表無設(shè)計(jì)優(yōu)劣高下之分,決定使用兩站表中的哪一張的根據(jù)是這組數(shù)據(jù)的用途,如果這張表是用于向讀者展示世界上的TOP 10山峰,則山峰的高度則是重點(diǎn)信息,a表的展示方式會更加合適;反之,如果這張表意在展示10大高峰中,哪座山峰是人類最先登頂?shù)?,人類先后登頂?shù)臅r間順序是讀者的主要興趣點(diǎn),則表b就更加適用。
2. 減少讀者計(jì)算 其實(shí)類似上一點(diǎn),表格的指標(biāo)也不是永遠(yuǎn)固定的,而是從讀者閱讀表格的目的出發(fā),調(diào)整所需展示的指標(biāo)。在原始數(shù)據(jù)的基礎(chǔ)上給出差值、總計(jì)等分析性的數(shù)據(jù),可以直達(dá)用戶閱讀的目標(biāo),而盡量減少用戶心算或者線下處理的過程。
例如下圖展示了2010年與2009年兩年的公司財(cái)政報(bào)表,查看兩年的具體數(shù)據(jù)當(dāng)然必要,但深入分析,讀者之所以要并列查看兩年的數(shù)據(jù),目的在于對比兩年的數(shù)據(jù)變化,因此將指標(biāo)變化情況列出能幫助用戶更快的達(dá)成目標(biāo)。3.精簡指標(biāo),創(chuàng)造信息層級 盡量減少或壓縮指標(biāo)數(shù)量,避免出現(xiàn)用戶不需要的數(shù)據(jù),默認(rèn)只展示用戶所必須的信息,用戶需要的非重點(diǎn)輔助信息可以通過提供深入細(xì)節(jié)的入口(彈窗、下拉)等形式來解決,僅在用戶需要時進(jìn)行提供。
創(chuàng)造信息層級,避免無主次的鋪出所有信息,干擾用戶快速掃描定位目標(biāo)條目。例如易迅的“我的訂單”列表中,就將用戶的信息、訂單狀態(tài)跟蹤信息進(jìn)行了默認(rèn)隱藏,同時通過鏈接色很好的提示了進(jìn)一步細(xì)節(jié)信息的入口,在用戶需要時,可以方便的查閱。
4.不留空白單元格 當(dāng)表格單元格中沒有相應(yīng)數(shù)據(jù)時,要避免直接留出空白單元格??瞻讍卧袢菀自斐勺x者的困惑甚至誤解,讀者會搞不清楚到底是沒有數(shù)據(jù),還是根本沒有值?正確做法,沒有數(shù)據(jù)的顯示0,給沒有值的單元格劃線或者打叉。
如下圖:5.斑馬條的運(yùn)用 橫向或縱向的斑馬線以及懸停高亮底色能夠很好的引導(dǎo)用戶的視線,避免在閱讀時出現(xiàn)錯行、迷失的情況:斑馬線會使得行與行的界限更為分明,尤其對數(shù)據(jù)列較多時的橫向引導(dǎo)得到加強(qiáng),這樣看行內(nèi)的內(nèi)容時不容易錯行,而懸停變色行主要是配合操作交互,明確區(qū)分出光標(biāo)所在的行。6.高亮重點(diǎn)信息,提高閱讀速度 通過合理的使用icon、背景色等視覺元素高亮重點(diǎn)信息,能夠提高用戶的閱讀速度,幫助讀者更快定位重點(diǎn)信息,例如下表中利用紅綠的上下箭頭很好的向用戶表達(dá)了年度財(cái)務(wù)的變化情況。
7.對齊,便于用戶快速瀏覽 對比的數(shù)據(jù)如果有了明確的對齊方式,會大大提升數(shù)據(jù)的瀏覽效率,增加對比的效果。通常,我們將數(shù)據(jù)右對齊,便于對比:通過數(shù)字位數(shù)的長短即可對比數(shù)字的量級和大?。晃淖肿髮R,符合人們閱讀從左到右的習(xí)慣;而對一些固定長度的狀態(tài)文字(如已完成,待支付等)采用居中對齊,使這些狀態(tài)文字更突出。
像下面的圖中,如果數(shù)據(jù)居中對齊沒。
數(shù)據(jù)分析的三個常用方法:
1. 數(shù)據(jù)趨勢分析
趨勢分析一般而言,適用于產(chǎn)品核心指標(biāo)的長期跟蹤,比如,點(diǎn)擊率,GMV,活躍用戶數(shù)等。做出簡單的數(shù)據(jù)趨勢圖,并不算是趨勢分析,趨勢分析更多的是需要明確數(shù)據(jù)的變化,以及對變化原因進(jìn)行分析。
趨勢分析,最好的產(chǎn)出是比值。在趨勢分析的時候需要明確幾個概念:環(huán)比,同比,定基比。環(huán)比是指,是本期統(tǒng)計(jì)數(shù)據(jù)與上期比較,例如2019年2月份與2019年1月份相比較,環(huán)比可以知道最近的變化趨勢,但是會有些季節(jié)性差異。為了消除季節(jié)差異,于是有了同比的概念,例如2019年2月份和2018年2月份進(jìn)行比較。定基比更好理解,就是和某個基點(diǎn)進(jìn)行比較,比如2018年1月作為基點(diǎn),定基比則為2019年2月和2018年1月進(jìn)行比較。
比如:2019年2月份某APP月活躍用戶數(shù)我2000萬,相比1月份,環(huán)比增加2%,相比去年2月份,同比增長20%。趨勢分析另一個核心目的則是對趨勢做出解釋,對于趨勢線中明顯的拐點(diǎn),發(fā)生了什么事情要給出合理的解釋,無論是外部原因還是內(nèi)部原因。
2. 數(shù)據(jù)對比分析
數(shù)據(jù)的趨勢變化獨(dú)立的看,其實(shí)很多情況下并不能說明問題,比如如果一個企業(yè)盈利增長10%,我們并無法判斷這個企業(yè)的好壞,如果這個企業(yè)所處行業(yè)的其他企業(yè)普遍為負(fù)增長,則5%很多,如果行業(yè)其他企業(yè)增長平均為50%,則這是一個很差的數(shù)據(jù)。
對比分析,就是給孤立的數(shù)據(jù)一個合理的參考系,否則孤立的數(shù)據(jù)毫無意義。在此我向大家推薦一個大數(shù)據(jù)技術(shù)交流圈: 658558542 突破技術(shù)瓶頸,提升思維能力 。
一般而言,對比的數(shù)據(jù)是數(shù)據(jù)的基本面,比如行業(yè)的情況,全站的情況等。有的時候,在產(chǎn)品迭代測試的時候,為了增加說服力,會人為的設(shè)置對比的基準(zhǔn)。也就是A/B test。
比較試驗(yàn)最關(guān)鍵的是A/B兩組只保持單一變量,其他條件保持一致。比如測試首頁改版的效果,就需要保持A/B兩組用戶質(zhì)量保持相同,上線時間保持相同,來源渠道相同等。只有這樣才能得到比較有說服力的數(shù)據(jù)。
3. 數(shù)據(jù)細(xì)分分析
在得到一些初步結(jié)論的時候,需要進(jìn)一步地細(xì)拆,因?yàn)樵谝恍┚C合指標(biāo)的使用過程中,會抹殺一些關(guān)鍵的數(shù)據(jù)細(xì)節(jié),而指標(biāo)本身的變化,也需要分析變化產(chǎn)生的原因。這里的細(xì)分一定要進(jìn)行多維度的細(xì)拆。常見的拆分方法包括:
分時 :不同時間短數(shù)據(jù)是否有變化。
分渠道 :不同來源的流量或者產(chǎn)品是否有變化。
分用戶 :新注冊用戶和老用戶相比是否有差異,高等級用戶和低等級用戶相比是否有差異。
分地區(qū) :不同地區(qū)的數(shù)據(jù)是否有變化。
組成拆分 :比如搜索由搜索詞組成,可以拆分不同搜索詞;店鋪流量由不用店鋪產(chǎn)生,可以分拆不同的店鋪。
細(xì)分分析是一個非常重要的手段,多問一些為什么,才是得到結(jié)論的關(guān)鍵,而一步一步拆分,就是在不斷問為什么的過程。
統(tǒng)計(jì)數(shù)據(jù)的搜集方法:
在實(shí)際調(diào)查中,搜集數(shù)據(jù)的具體方法主要有訪問調(diào)查、郵寄調(diào)查、電話調(diào)查、座談會、個別深度訪問、網(wǎng)上調(diào)查。
1、訪問調(diào)查:
訪問調(diào)查又稱派員調(diào)查,它是調(diào)查者與被調(diào)查者通過面對面地交談從而得到所需資料的調(diào)查方法。
2、郵寄調(diào)查:
郵寄調(diào)查是通過郵寄或其他方式將調(diào)查問卷送至被調(diào)查者,由被調(diào)查者填寫,然后將問卷寄回或投放到指定收集點(diǎn)的一種調(diào)查方法。
3、電話調(diào)查:
電話調(diào)查是調(diào)查人員利用電話通受訪者進(jìn)行語言交流,從而獲得信息的一種調(diào)查方式。電話調(diào)查優(yōu)點(diǎn)是時效快、費(fèi)用低;不足是調(diào)查問題的數(shù)量不能過多。
4、座談會:
座談會也稱為集體訪談法,它是將一組受訪者集中在調(diào)查現(xiàn)場,讓他們對調(diào)查的主題發(fā)表意見,從而獲取調(diào)查資料的一種方法。這種方法適用于搜集與研究課題有密切關(guān)系的少數(shù)人員的傾向和意見。
5、個別深度訪問:
個別深度訪問是一次只有一名受訪者參加的特殊的定性研究。常用于動機(jī)研究,以發(fā)掘受訪者非表面化的深層次意見。這種方法最適宜于研究較隱秘的問題,如個人隱私;較敏感的問題等。
6、網(wǎng)上調(diào)查:
網(wǎng)上調(diào)查主要有E-mail、交互式CATI系統(tǒng)、互聯(lián)網(wǎng)CGI程序三種方法。
拓展資料:
統(tǒng)計(jì)數(shù)據(jù)搜集的組織形式:
統(tǒng)計(jì)數(shù)據(jù)搜集的組織形式有普查、抽樣調(diào)查、統(tǒng)計(jì)報(bào)表、重點(diǎn)調(diào)查、典型調(diào)查等。
1、普查:
普查是為了某種特定的目的而專門組織的一次性的全面調(diào)查,用以搜集重要國情國力和資源狀況的全面資料,為政府制定規(guī)劃、方針政策提供依據(jù)。
2、抽樣調(diào)查:
抽樣調(diào)查是實(shí)際應(yīng)用中最廣泛的一種調(diào)查方法,他是從調(diào)查對象的總體中隨機(jī)抽取一部分單位座位樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查方法。
3、統(tǒng)計(jì)報(bào)表:
統(tǒng)計(jì)報(bào)表是一種以全面調(diào)查為主的調(diào)查方式,它是由政府主管部門根據(jù)統(tǒng)計(jì)法規(guī),以統(tǒng)計(jì)表格形式和行政手段自上而下布置,而后由企、事業(yè)單位自下而上層層匯總上報(bào)逐級提供基本統(tǒng)計(jì)數(shù)據(jù)的一種調(diào)查方式
4、重點(diǎn)調(diào)查:
重點(diǎn)調(diào)查是專門組織的一種非全面調(diào)查,它是在總體中選擇個別的或部分重點(diǎn)單位進(jìn)行調(diào)查,以了解總體的基本情況。
5、典型調(diào)查:
典型調(diào)查也是專門組織的一種非全面調(diào)查,它是根據(jù)調(diào)查研究的目的和要求,在對總體進(jìn)行全面分析的基礎(chǔ)上,有意識的選擇其中有代表性的典型單位進(jìn)行深入細(xì)致的調(diào)查,借以認(rèn)識事物的本質(zhì)特征、因果關(guān)系和發(fā)展變化規(guī)律。
一、掌握基礎(chǔ)、更新知識。
基本技術(shù)怎么強(qiáng)調(diào)都不過分。這里的術(shù)更多是(計(jì)算機(jī)、統(tǒng)計(jì)知識), 多年做數(shù)據(jù)分析、數(shù)據(jù)挖掘的經(jīng)歷來看、以及業(yè)界朋友的交流來看,這點(diǎn)大家深有感觸的。
數(shù)據(jù)庫查詢—SQL 數(shù)據(jù)分析師在計(jì)算機(jī)的層面的技能要求較低,主要是會SQL,因?yàn)檫@里解決一個數(shù)據(jù)提取的問題。有機(jī)會可以去逛逛一些專業(yè)的數(shù)據(jù)論壇,學(xué)習(xí)一些SQL技巧、新的函數(shù),對你工作效率的提高是很有幫助的。
統(tǒng)計(jì)知識與數(shù)據(jù)挖掘 你要掌握基礎(chǔ)的、成熟的數(shù)據(jù)建模方法、數(shù)據(jù)挖掘方法。例如:多元統(tǒng)計(jì):回歸分析、因子分析、離散等,數(shù)據(jù)挖掘中的:決策樹、聚類、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)等。
但是還是應(yīng)該關(guān)注一些博客、論壇中大家對于最新方法的介紹,或者是對老方法的新運(yùn)用,不斷更新自己知識,才能跟上時代,也許你工作中根本不會用到,但是未來呢?行業(yè)知識 如果數(shù)據(jù)不結(jié)合具體的行業(yè)、業(yè)務(wù)知識,數(shù)據(jù)就是一堆數(shù)字,不代表任何東西。是冷冰冰,是不會產(chǎn)生任何價值的,數(shù)據(jù)驅(qū)動營銷、提高科學(xué)決策一切都是空的。
一名數(shù)據(jù)分析師,一定要對所在行業(yè)知識、業(yè)務(wù)知識有深入的了解。例如:看到某個數(shù)據(jù),你首先必須要知道,這個數(shù)據(jù)的統(tǒng)計(jì)口徑是什么?是如何取出來的?這個數(shù)據(jù)在這個行業(yè), 在相應(yīng)的業(yè)務(wù)是在哪個環(huán)節(jié)是產(chǎn)生的?數(shù)值的代表業(yè)務(wù)發(fā)生了什么(背景是什么)?對于A部門來說,本月新會員有10萬,10萬好還是不好呢?先問問上面的這個問題:對于A部門,1、新會員的統(tǒng)計(jì)口徑是什么。
第一次在使用A部門的產(chǎn)品的會員?還是在站在公司角度上說,第一次在公司發(fā)展業(yè)務(wù)接觸的會員?2、是如何統(tǒng)計(jì)出來的。A:時間;是通過創(chuàng)建時間,還是業(yè)務(wù)完成時間。
B:業(yè)務(wù)場景。是只要與業(yè)務(wù)發(fā)接觸,例如下了單,還是要業(yè)務(wù)完成后,到成功支付。
3、這個數(shù)據(jù)是在哪個環(huán)節(jié)統(tǒng)計(jì)出來。在注冊環(huán)節(jié),在下單環(huán)節(jié),在成功支付環(huán)節(jié)。
4、這個數(shù)據(jù)代表著什么。10萬高嗎?與歷史相同比較?是否做了營銷活動?這個行業(yè)處理行業(yè)生命同期哪個階段?在前面二點(diǎn),更多要求你能按業(yè)務(wù)邏輯,來進(jìn)行數(shù)據(jù)的提?。ǜ嗍菍慡QL代碼從數(shù)據(jù)庫取出數(shù)據(jù))。
后面二點(diǎn),更重要是對業(yè)務(wù)了解,更行業(yè)知識了解,你才能進(jìn)行相應(yīng)的數(shù)據(jù)解讀,才能讓數(shù)據(jù)產(chǎn)生真正的價值,不是嗎?對于新進(jìn)入數(shù)據(jù)行業(yè)或者剛進(jìn)入數(shù)據(jù)行業(yè)的朋友來說:行業(yè)知識都重要,也許你看到很多的數(shù)據(jù)行業(yè)的同仁,在微博或者寫文章說,數(shù)據(jù)分析思想、行業(yè)知識、業(yè)務(wù)知識很重要。我非常同意。
因?yàn)樽鳛閿?shù)據(jù)分析師,在發(fā)表任何觀點(diǎn)的時候,都不要忘記你居于的背景是什么?但大家一定不要忘記了一些基本的技術(shù),不要把基礎(chǔ)去忘記了,如果一名數(shù)據(jù)分析師不會寫SQL,那麻煩就大了。哈哈。
你只有把數(shù)據(jù)先取對了,才能正確的分析,否則一切都是錯誤了,甚至?xí)?dǎo)致致命的結(jié)論。
新同學(xué),還是好好花時間把基礎(chǔ)技能學(xué)好。因?yàn)榛A(chǔ)技能你可以在短期內(nèi)快速提高,但是在行業(yè)、業(yè)務(wù)知識的是一點(diǎn)一滴的積累起來的,有時候是急不來的,這更需要花時間慢慢去沉淀下來。
不要過于追求很高級、高深的統(tǒng)計(jì)方法,我提倡有空還是要多去學(xué)習(xí)基本的統(tǒng)計(jì)學(xué)知識,從而提高工作效率,達(dá)到事半功倍。以我經(jīng)驗(yàn)來說,我負(fù)責(zé)任告訴新進(jìn)的同學(xué),永遠(yuǎn)不要忘記基本知識、基本技能的學(xué)習(xí)。
二、要有三心。1、細(xì)心。
2、耐心。3、靜心。
數(shù)據(jù)分析師其實(shí)是一個細(xì)活,特別是在前文提到的例子中的前面二點(diǎn)。而且在數(shù)據(jù)分析過程中,是一個不斷循環(huán)迭代的過程,所以一定在耐心,不怕麻煩,能靜下心來不斷去修改自己的分析思路。
三、形成自己結(jié)構(gòu)化的思維。數(shù)據(jù)分析師一定要嚴(yán)謹(jǐn)。
而嚴(yán)謹(jǐn)一定要很強(qiáng)的結(jié)構(gòu)化思維,如何提高結(jié)構(gòu)化思維,也許只需要工作隊(duì)中不斷的實(shí)踐。但是我推薦你用mindmanagement,首先把你的整個思路整理出來,然后根據(jù)分析不斷深入、得到的信息不斷增加的情況下去完善你的結(jié)構(gòu),慢慢你會形成一套自己的思想。
當(dāng)然有空的時候去看看《麥肯錫思維》、結(jié)構(gòu)化邏輯思維訓(xùn)練的書也不錯。在我以為多看看你身邊更資深同事的報(bào)告,多問問他們是怎么去考慮這個問題的,別人的思想是怎么樣的?他是怎么構(gòu)建整個分析體系的。
四、業(yè)務(wù)、行業(yè)、商業(yè)知識。當(dāng)你掌握好前面的基本知識和一些技巧性東西的時候,你應(yīng)該在業(yè)務(wù)、行業(yè)、商業(yè)知識的學(xué)習(xí)與積累上了。
這個放在最后,不是不重要,而且非常重要,如果前面三點(diǎn)是決定你能否進(jìn)入這個行業(yè),那么這則是你進(jìn)入這個行業(yè)后,能否成功的最根本的因素。 數(shù)據(jù)與具體行業(yè)知識的關(guān)系,比作池塘中魚與水的關(guān)系一點(diǎn)都不過分,數(shù)據(jù)(魚)離開了行業(yè)、業(yè)務(wù)背景(水)是死的,是不可能是“活”。
而沒有“魚”的水,更像是“死”水,你去根本不知道看什么(方向在哪)。如何提高業(yè)務(wù)知識,特別是沒有相關(guān)背景的同學(xué)。
很簡單,我總結(jié)了幾點(diǎn):1、多向業(yè)務(wù)部門的同事請教,多溝通。多向他們請教,數(shù)據(jù)分析師與業(yè)務(wù)部門沒有利益沖突,而更向是共生體,所以如果你態(tài)度好,相信業(yè)務(wù)部門的同事也很愿意把他們知道的告訴你。
2、永遠(yuǎn)不要忘記了google大神,定制一些行業(yè)的關(guān)鍵字,每天都先看看定制的郵件。3、每天有空去瀏。
聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請?jiān)谝粋€月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:3.365秒