用 R Notebook 交流研究——第 2 部分

用 R Notebook 交流研究——第 2 部分

今天,我們將繼續討論使用 R Notebook 交流研究的話題。我們將繼續研究一個基本框架,您可以使用該框架使用 R 交流研究結果。有關交流可重複研究的本系列的第一部分,請在此處查看。

目錄

做出假設

我們報告的下一步是做出假設。我們將在查看器窗格上創建另一個部分並折疊其他部分,以便我們可以看到高級報告。

對於這個假設,我們會寫出帶和不帶 CD-ROM 的計算機的銷售價格沒有差異。

用 R Notebook 交流研究——第 2 部分

在 R Notebook 中創建方法

我們將繼續討論方法,這將解決我們將用來回答該假設的實際技術。我們可能不需要做任何類型的推斷統計。根據聽眾的不同,我們將在這種情況下做一份高級研究報告。

我們會說我們將在 95% 的置信水平下進行抽樣測試,我們將目視檢查價格的分佈。如果它們大致正常,我們將進行測試。

用 R Notebook 交流研究——第 2 部分

保存我們的假設和方法後,我們可以從“預覽”選項卡將它們呈現為HTML 文件PDF 文檔Word 文檔

用 R Notebook 交流研究——第 2 部分

一旦我們將其作為 HTML 發送出去,這就是我們將在渲染框中看到的內容。

用 R Notebook 交流研究——第 2 部分

它在這裡說輸出已經創建,所以讓我們轉到我們的文件資源管理器來檢查它。在我們的 HTML 文件中打開它後,我們可以看到它看起來與我們在預覽按鈕中看到的非常相似。

用 R Notebook 交流研究——第 2 部分

此時我們沒有看到任何錯誤消息,我們也看到了定制的空間。我們甚至可以使用這些工具以及R MarkdownR Notebooks編寫整本書或網站。

讓我們回到我們的腳本並繼續。我們將寫下我們將使用的方法以及我們的結果。我們基本上是在開源我們的計劃,並且我們明確表示我們不會只是為了看看什麼能堅持下去而把東西扔到牆上。當我們獲得數據時,我們並不是即興創作;我們實際上有一個計劃。

嘗試很多不同的事情有一些好處,對吧?但在這種方法中,我們有目的地說,“這就是我們要做的,然後我們就會去做。”

用 R Notebook 交流研究——第 2 部分

在 R Notebook 中處理描述性統計

讓我們做我們的描述性統計。我們想找出每組有和沒有 CD-ROM 的價格。有幾種方法可以做到這一點。我們將調用此組摘要並引入此管道操作符。如果您不熟悉管道運算符,可以查看我之前談到的資源。

然後我們將對記錄進行匯總計數以找到平均價格 = 平均價格。最後,我們要打印這個組摘要然後運行它。

用 R Notebook 交流研究——第 2 部分

現在我們開始。我們現在有了我們的桌子。

用 R Notebook 交流研究——第 2 部分

正如我之前所說,我們想知道每組中有多少觀察值以及平均價格是多少。我們可以使用內聯引用使其完全動態化。

我們將進行分組匯總並使用tidyverse操作。我們將過濾這一行,然後採用這些值之一併將其轉換為實際呈現在我們此處的內聯引用中的內容。

用 R Notebook 交流研究——第 2 部分

保存後,轉到預覽筆記本查看結果。

用 R Notebook 交流研究——第 2 部分

用 R Notebook 交流研究——第 2 部分

在 R Notebook 中構建可視化

R 以其可視化功能而聞名。對於我們的可視化,我們將使用ggplot。我們會將價格放在 X 軸上,然後創建直方圖我們還將為 facet 創建小的倍數,這實際上在ggplot中很容易做到。

用 R Notebook 交流研究——第 2 部分

用 R Notebook 交流研究——第 2 部分

我們可以在這裡更改很多東西,例如標題、背景、顏色等等。一旦我們保存它,我們就可以看到情節。這現在不是交互式的,但是有很多方法可以讓它在 R 中交互。對於這個例子,我們只做一個靜態圖。

用 R Notebook 交流研究——第 2 部分

我們的結果顯示了一些看起來像鐘形曲線分佈的東西,這意味著我們應該繼續我們的分析。

我們將運行 T 檢驗結果並將其插入到報告中。我們將添加另一個 R 塊並將其命名為cd_test。如果我們現在運行它,結果將包含大量信息,並且很難從中提取單個元素。

我們將使用tidy 函數將其以表格格式顯示。一旦我們做了一個整潔的cd_test,它就會把所有東西變成一個漂亮的表結構。我們也可以打印它以實際顯示在我們的報告中。

用 R Notebook 交流研究——第 2 部分

我們可以做的另一件事是找到上下置信區間。我們不想展示這部分,因為這只是暫存。

用 R Notebook 交流研究——第 2 部分

總的來說,它看起來像一個實時動態文檔,比將單個數據點和表格複製並粘貼到報告中要好得多。您可以將其發送給同事,理想情況下,他們只需單擊“預覽”即可了解您的工作並能夠在此基礎上進行構建。

以結論結束

我們的報告接近尾聲,所以我們將寫下結論。

用 R Notebook 交流研究——第 2 部分

我們還可以在此處包含一個附錄來展示我們的資源。有一個附錄的好處是,如果你最終向某人展示這個或展示這個,他們會問你的數據來源是誰或者是如何衡量的。這些都是有效的問題,有一個帶有資源的附錄真的很有幫助,因為這樣你就可以直接指向附錄。

用 R Notebook 交流研究——第 2 部分

我們還可以包含圖像並使用替代文本。這是基本描述圖像顯示內容的好習慣。如果您是 HTML 用戶,則可以使用 HTML 嵌入此圖像。

用 R Notebook 交流研究——第 2 部分

結論

對於本教程,我們實際上瀏覽了整個報告。這是一個非常粗略的草稿,但我們已經設法使用 R Markdown 為我們的研究報告創建了一個結構。

我們首先討論了記錄所有內容的可重複性。您可以使用 R Markdown 和此框架來創建網站、書籍和博客等內容。作為分析師,您需要構建的幾乎任何類型的產品都可以使用 RStudio 創建。

如需進一步閱讀,請隨時查看我的名為Advancing into Analytics的書。這是對使用 Excel、Python 和 R 進行數據分析和統計分析的很好的基本介紹。我也有針對LuckyTemplates 用戶的 R課程。您也可能會在某個時候看到本系列的第三門課程。

用 R Notebook 交流研究——第 2 部分

我希望你從這個 R Notebook 教程中學到了一些東西,並且很想看看你最終如何使用這些工具。

喬治山


什麼是 Python 中的自我:真實世界的例子

什麼是 Python 中的自我:真實世界的例子

什麼是 Python 中的自我:真實世界的例子

如何在 R 中保存和加載 RDS 文件

如何在 R 中保存和加載 RDS 文件

您將學習如何在 R 中保存和加載 .rds 文件中的對象。本博客還將介紹如何將對像從 R 導入 LuckyTemplates。

回顧前 N 個工作日——DAX 編碼語言解決方案

回顧前 N 個工作日——DAX 編碼語言解決方案

在此 DAX 編碼語言教程中,了解如何使用 GENERATE 函數以及如何動態更改度量標題。

在 LuckyTemplates 中使用多線程動態視覺技術展示見解

在 LuckyTemplates 中使用多線程動態視覺技術展示見解

本教程將介紹如何使用多線程動態可視化技術從報告中的動態數據可視化中創建見解。

LuckyTemplates 篩選上下文簡介

LuckyTemplates 篩選上下文簡介

在本文中,我將貫穿過濾器上下文。篩選上下文是任何 LuckyTemplates 用戶最初應該了解的主要主題之一。

使用 LuckyTemplates 在線服務中的應用程序的最佳技巧

使用 LuckyTemplates 在線服務中的應用程序的最佳技巧

我想展示 LuckyTemplates Apps 在線服務如何幫助管理從各種來源生成的不同報告和見解。

隨著時間的推移分析利潤率變化——使用 LuckyTemplates 和 DAX 進行分析

隨著時間的推移分析利潤率變化——使用 LuckyTemplates 和 DAX 進行分析

了解如何在 LuckyTemplates 中使用度量分支和組合 DAX 公式等技術計算利潤率變化。

DAX Studio 中數據緩存的物化想法

DAX Studio 中數據緩存的物化想法

本教程將討論數據緩存物化的想法,以及它們如何影響 DAX 在提供結果時的性能。

使用 LuckyTemplates 進行業務報告

使用 LuckyTemplates 進行業務報告

如果直到現在你還在使用 Excel,那麼現在是開始使用 LuckyTemplates 來滿足你的業務報告需求的最佳時機。

什麼是 LuckyTemplates 網關?所有你必須知道的

什麼是 LuckyTemplates 網關?所有你必須知道的

什麼是 LuckyTemplates 網關?所有你必須知道的