什麼是 Python 中的自我:真實世界的例子
什麼是 Python 中的自我:真實世界的例子
在這篇博文中,我們將著眼於使用 R 筆記本交流研究並展示這些結果。我們希望您將從本教程中獲得的是一個框架,供您使用 R notebooks 報告和交流任何類型的研究結果。
這樣做有一些很大的優勢,特別是涉及到可重複研究的想法時。我們將討論這意味著什麼以及如何在 R 筆記本中執行此操作。
目錄
什麼是再現性?
可重複性的概念是任何人都可以審核您的發現,並根據您使用的輸入和流程,他們應該能夠完成整個過程。這有幾種方式可以滿足我們的數據分析需求:使事物可重現的環境,確保人們可以看到貢獻的內容,能夠輕鬆審核文件以及擁有可重現的發布者。
理想情況下,有人可以準確地看到您是如何得到報告的,以及您使用的圖表或表格是如何生成的,這樣一切都在一個完全可重現的環境中。
現在您可能想知道LuckyTemplates或Excel之類的東西如何適應這一點。我會說它在這個可重現的工作流程中處於中途。當我們特別考慮冪查詢時,它的重現性非常好。想一想應用步驟,其中很明顯可以看到所涉及的過程。
當談到可視化和報告時,這就是事情變得有點棘手的地方。R 筆記本是 RStudio 的一部分。我們在 LuckyTemplates 門戶網站上有一個課程可以幫助您入門和運行。本特別討論R Markdown和R Notebooks。
因此,如果您熟悉Jupyter notebook,其想法是我們能夠穿插文本和代碼來為我們的研究創建一個講故事的文檔。
我們將能夠在一堆不同的輸出中呈現這些結果。無論您需要創建 PDF 還是將其呈現為 HTML,R Notebooks 都可以用於不同的文件格式。
首先,打開你的 R notebook 並轉到文件,新建文件,然後在 RStudio 中選擇 R Notebook。我們將使用資源中的舊數據集,並提出這個非常簡單的研究問題:
電腦的價格是否完全取決於它是否有 CD-ROM?
這個問題已經過時了,但我們都必須從某個地方開始。我們還將放置一份研究報告的骨架,並使用這個基本框架展示研究結果。
我們將在 RStudio 中看到類似的東西,這就是所謂的 .rmd 文件,它是 R markdown 文件擴展名。這可能有點不和諧,特別是如果您不習慣它,但是有一種方法可以預覽經過拋光的最終產品。
notebook 的這一部分是稱為 YAML 文件的元數據。
在該部分之後是您的代碼所在的這些返回文本。然後是使用R Markdown的文檔的文本部分。如果您以前使用過 Markdown,那麼 R markdown 非常相似。我們可以使用星號和哈希符號之類的東西來標記和呈現我們的文本。
讓我們轉到 R Studio 和 R Notebooks,然後一起完成此分析。單擊齒輪並確保顯示Preview in Viewer Pane。
啟動 R 筆記本
我們將單擊“預覽”按鈕,它會要求我們保存它。同樣,這是一個 RMD 文件,所以我們需要先保存它。在左窗格中,我們將看到渲染後的輸出。現在,如果我們要在此處更改任何內容並說出諸如Computers analysis之類的內容並添加作者姓名(例如George Mount ),則需要用引號引起來。
一旦我們點擊Save,它會自動更新為這個。
因此,讓我們嘗試一下。這裡已經有幾個佔位符,這很好。我們要做的第一件事是輸入“CD-ROM 會影響銷售價格嗎?” 當我們保存這個時,它將是 Header1。但是如果我們要把這個變成兩個hash mark,它就會變成Header2,而且會變小。
下一步是做一個Introduction,我們可以在其中輸入為什麼這些東西很重要。例如,我們可以說 CD-ROM 是下一個最好的東西或類似的東西。如果您正在處理消費者報告或在營銷部門工作,您會試圖了解哪些功能真正重要或消費者正在尋找什麼。
我們將調用 R 包並開始。我喜歡這裡的一件好事是我們實際上可以在 R Notebook 中使用 HTML。例如,如果我們想給自己留言,我們可以這樣做。
當我們保存它時,它根本不顯示。所以我們只是在文本中留下這個作為對我們自己的評論。這是我希望我們可以在像 MS Word 這樣的地方做的事情。
介紹 R Notebooks 中的包
下一步是在此處使用此代碼圖並添加一些設置。我們可以使用 Python 和 SQL,但我們在此示例中使用 R。
我們將閱讀我們需要的所有包。如果您的計算機上沒有這些,您可能需要安裝它們。
同樣,這不是一份完整的報告。我們將通過框架向您展示一些關於 R Markdown 的知識。
所以現在我們要介紹我們從哪裡獲得數據,以及它的重要性。在這種情況下,我們可以說我們的來源是《應用計量經濟學雜誌》。當我們做這個星號的事情時,它會把它變成斜體。
然後我們將在 Excel 中讀取一個文件並使用 R 將其導入。如您所見,數據看起來已經很不錯了,這是 R Notebooks 的另一個很酷的地方。
根據輸出格式,這甚至可能會顯示出來。如果您使用的是 HTML,您的用戶實際上可以瀏覽數據並進行一些基本的交互。很高興我們真的能夠在實時文檔中完成這些工作。
在 R 筆記本中添加動態引用
現在假設我們想要在數據文本中包含一個動態引用。我們希望它定期更新,因為每次我們在報告中可能都不一樣,對嗎?因此,我們將在此處在線進行動態引用,就在文本中。
所有這些代碼都有備忘單和參考指南。轉到“幫助”並為 R Markdown 選擇一個,這樣您就可以查找所有不同的設置。嘗試記住它們可能不值得,因為有很多,你可以只用這個代替。
我們將再次插入 R 塊並包括FALSE、nrows和ncols。
一旦它被運行和執行,我們甚至可以去 R 環境看看它是否已經變成了對象。
另一件好事是,如果您只是隨便亂扔想法,並且想知道它的實際外觀,您可以使用底部的控制台。我們可以在控制台運行它並查看輸出結果。
我們將返回查看器窗格。現在這裡的這一部分根本沒有出現在報告中。如果您想使用某個對象,但不想顯示任何代碼,這很好。
我們在 nrows 和 ncols 上使用這些背景文本來保持動態。如果您有 PDF 報告並且需要自動更改這些數字,而不是一周又一周地對它們進行硬編碼,您可以使用這些內聯引用。
我們正在再次探索數據並檢查計算機的價格。
運行此代碼後,我們可以看到格式良好的描述性統計信息。根據數據的大小,它對文件的大小反應靈敏。
結論
對於本教程,我們討論了通過使用 R Notebooks 開發可重複研究和簡化交流研究結果過程的重要性。這樣,我們可以快速輕鬆地重現原始結果並追溯以確定它們是如何得出的。
請注意本系列第 2 部分中本教程的後續內容。
喬治山
什麼是 Python 中的自我:真實世界的例子
您將學習如何在 R 中保存和加載 .rds 文件中的對象。本博客還將介紹如何將對像從 R 導入 LuckyTemplates。
在此 DAX 編碼語言教程中,了解如何使用 GENERATE 函數以及如何動態更改度量標題。
本教程將介紹如何使用多線程動態可視化技術從報告中的動態數據可視化中創建見解。
在本文中,我將貫穿過濾器上下文。篩選上下文是任何 LuckyTemplates 用戶最初應該了解的主要主題之一。
我想展示 LuckyTemplates Apps 在線服務如何幫助管理從各種來源生成的不同報告和見解。
了解如何在 LuckyTemplates 中使用度量分支和組合 DAX 公式等技術計算利潤率變化。
本教程將討論數據緩存物化的想法,以及它們如何影響 DAX 在提供結果時的性能。
如果直到現在你還在使用 Excel,那麼現在是開始使用 LuckyTemplates 來滿足你的業務報告需求的最佳時機。
什麼是 LuckyTemplates 網關?所有你必須知道的