什麼是 Python 中的自我:真實世界的例子
什麼是 Python 中的自我:真實世界的例子
在這篇文章中,我們將向您展示如何在 Excel 中使用卡方檢驗來比較變量。您可以在本博客底部觀看本教程的完整視頻。
卡方獨立性檢驗有兩個分類變量。我們將找出這些變量之間是否存在任何關係。
我們將使用假設檢驗框架。如果您對此不熟悉,請查看 Advancing Into Analytics 一書。這是一種使用Excel、R 和 Python 的高級分析技術。
對於我們的演示,我們將使用 Excel 中的住房數據集。我們需要使用數據透視表獲取實際值,然後使用公式將其與預期值進行比較。
我們還將檢查 95% 的顯著性水平,以及空調和首選區域之間是否存在關係。
目錄
在 Excel 中使用卡方檢驗比較變量
讓我們進入 Excel。這些是來自《應用計量經濟學雜誌》的房價。
插入數據透視表,然後單擊 “確定”以使用索引列來計算觀察值。
從數據透視表字段中,將“ id ” 拖到“值”部分。從值字段設置中選擇 計數 ,因為這些都是唯一值。
接下來是將“ prefarea ”拖到列中,然後將“ airco ”拖到行部分以查看實際值。
我們總共有 546 個觀察結果。298 既不是空調也不是首選區域,而 53 兩者都是,依此類推。
讓我們創建兩個表並將它們標記為Actual和Expected。
要獲得空調和首選區域的預期值,請將 D5 乘以 B7,然後除以 D7。
接下來是獲得空調或首選區域的預期值,將 D5 乘以 C7,然後除以 D7。
現在對於首選區域或空調的預期值,將 D6 乘以 B7,然後除以 D7。
最後,讓我們計算空調和首選區域的預期值。將 D6 乘以 C7,然後除以 D7。
突出顯示期望值的範圍以找出總和,它應該是 546。
現在我們將找到實際值和預期值之間的關係。讓我們檢查一下它們是否傾向於以某種方式一起移動。
要查找重要性,請鍵入 =CHISQ.TEST。突出顯示實際值的範圍,添加逗號,然後突出顯示預期值的範圍以獲得 p 值。
根據結果,這是一個輕微的隨機機會。首選面積變量和空調變量之間似乎存在某種關係。
使用 Power Query 在 Excel 中使用 Anti Join 合併
查詢計算 Excel 中的不同值:從經典到現代的方法
Excel 中的比例和頻率表
結論
卡方檢驗是一種常用的技術,可以幫助我們了解類別差異,是 A/B 測試的一個很好的例子。
另一件要記住的事情是觀察需要是獨立的。基於我們的示例,我們正在查看兩個二元變量,一種特定類型的分類變量。
最後,讓我們意識到當我們有很多類別時它會變得棘手。
我希望這是您可以用於 A/B 測試的東西,無論是在Excel還是 Python 中。
一切順利,
什麼是 Python 中的自我:真實世界的例子
您將學習如何在 R 中保存和加載 .rds 文件中的對象。本博客還將介紹如何將對像從 R 導入 LuckyTemplates。
在此 DAX 編碼語言教程中,了解如何使用 GENERATE 函數以及如何動態更改度量標題。
本教程將介紹如何使用多線程動態可視化技術從報告中的動態數據可視化中創建見解。
在本文中,我將貫穿過濾器上下文。篩選上下文是任何 LuckyTemplates 用戶最初應該了解的主要主題之一。
我想展示 LuckyTemplates Apps 在線服務如何幫助管理從各種來源生成的不同報告和見解。
了解如何在 LuckyTemplates 中使用度量分支和組合 DAX 公式等技術計算利潤率變化。
本教程將討論數據緩存物化的想法,以及它們如何影響 DAX 在提供結果時的性能。
如果直到現在你還在使用 Excel,那麼現在是開始使用 LuckyTemplates 來滿足你的業務報告需求的最佳時機。
什麼是 LuckyTemplates 網關?所有你必須知道的