연구 커뮤니케이션을 위한 R 노트북

연구 커뮤니케이션을 위한 R 노트북

이 블로그 게시물에서는 R 노트북을 사용하여 연구를 전달하고 그 결과를 제시하는 방법을 살펴보겠습니다. 이 자습서에서 얻을 수 있는 내용이 R 노트북을 사용하여 모든 종류의 연구 결과를 보고하고 전달할 수 있는 프레임워크가 되기를 바랍니다.

특히 재현 가능한 연구 아이디어와 관련하여 이렇게 하면 몇 가지 큰 이점이 있습니다 . 이것이 의미하는 바와 R 노트북에서 이를 수행하는 방법에 대해 논의할 것입니다.

연구 커뮤니케이션을 위한 R 노트북

목차

재현성이란 무엇입니까?

재현성이라는 아이디어는 누구든지 당신이 발견한 것을 감사할 수 있고 당신이 사용한 입력과 프로세스가 주어지면 모든 것을 검토할 수 있어야 한다는 것입니다. 이것이 우리의 데이터 분석 요구 사항에 적용되는 몇 가지 방법이 있습니다. 즉, 사물을 재현할 수 있는 환경, 기여한 내용을 사람들이 볼 수 있도록 하는 환경, 파일을 쉽게 감사할 수 있고 재현 가능한 게시자가 있는 것입니다.

이상적으로는 누군가가 보고서에 도달한 방법과 사용한 플롯 또는 테이블이 생성된 방법을 정확하게 볼 수 있으므로 모든 것이 완전히 재현 가능한 환경에 있습니다.

이제 LuckyTemplates 또는 Excel 과 같은 것이 여기에 어떻게 부합하는지 궁금할 것입니다 . 이 재현 가능한 작업 흐름의 중간에 있다고 말할 수 있습니다. 특히 파워 쿼리 에 대해 생각할 때 재현성이 매우 뛰어납니다. 관련된 프로세스를 보는 것이 매우 분명한 적용 단계를 생각해 보십시오 .

시각화 및 보고서와 관련하여 상황이 조금 더 복잡해지는 부분입니다. R 노트북은 RStudio의 일부입니다. LuckyTemplates 포털에는 시작하고 실행할 수 있는 과정이 있습니다. 특히 이 특히 R MarkdownR Notebooks 에 대한 이야기입니다.

따라서 Jupyter 노트북 에 익숙하다면 연구를 위한 스토리텔링 문서를 만들기 위해 텍스트와 코드를 배치할 수 있다는 아이디어가 떠오를 것입니다.

우리는 이러한 결과를 다양한 출력으로 렌더링할 수 있습니다. PDF를 생성하거나 HTML로 렌더링해야 하는 경우 R Notebooks를 다양한 파일 형식에 사용할 수 있습니다.

연구 커뮤니케이션을 위한 R 노트북

시작하려면 R 노트북을 열고 RStudio에서 파일, 새 파일, R 노트북으로 이동합니다. 우리는 다음과 같은 매우 간단한 연구 질문으로 리소스의 이전 데이터 세트로 작업할 것입니다.

컴퓨터의 가격은 CD-ROM이 있는지 여부에 따라 달라집니까?

이 질문은 구식이지만 우리 모두는 어딘가에서 시작해야 합니다. 우리는 또한 연구 보고서의 뼈대를 놓고 이 기본 프레임워크를 사용하여 연구 결과를 제시할 것입니다.

연구 커뮤니케이션을 위한 R 노트북

RStudio에서 이와 같은 것을 보게 될 것입니다. 이것은 R 마크다운 파일 확장자인 .rmd 파일이라고 하는 것입니다. 특히 익숙하지 않은 경우 약간 거슬릴 수 있지만 세련된 최종 제품을 미리 볼 수 있는 방법이 있습니다.

연구 커뮤니케이션을 위한 R 노트북

노트북의 이 부분은 YAML 파일이라는 메타데이터입니다.

연구 커뮤니케이션을 위한 R 노트북

그 섹션 뒤에는 코드가 들어갈 백 텍스트가 있습니다. 그런 다음 R Markdown을 사용하는 문서의 텍스트 부분이 있습니다 . 이전에 Markdown을 사용한 적이 있다면 R markdown은 매우 유사합니다. 별표 및 해시 기호와 같은 것을 사용하여 텍스트를 표시하고 렌더링할 수 있습니다.

R Studio 및 R Notebooks로 이동한 다음 이 분석을 함께 살펴보겠습니다. 톱니바퀴를 클릭하고 Viewer Pane에서 미리보기 로 표시되는지 확인합니다 .

연구 커뮤니케이션을 위한 R 노트북

R 노트북 시작하기

미리보기 버튼을 클릭하면 저장하라는 메시지가 표시됩니다. 다시 말하지만 이것은 RMD 파일이므로 먼저 저장해야 합니다. 왼쪽 창에서 렌더링된 출력을 볼 수 있습니다. 이제 여기에서 무언가를 변경하고 Computers analysis 와 같은 말을 하고 George Mount 와 같은 저자 이름을 추가하려면 따옴표로 묶어야 합니다.

Save 를 클릭하면 자동으로 업데이트됩니다.

연구 커뮤니케이션을 위한 R 노트북

그래서 이것으로 놀자. 여기에는 이미 몇 개의 자리 표시자가 있습니다. 괜찮습니다. 가장 먼저 할 일은 "CD-ROM이 판매 가격에 영향을 줍니까?"를 입력하는 것입니다. 이것을 저장하면 Header1이 됩니다. 그러나 이것을 두 개의 해시 마크로 바꾸면 Header2로 바뀌고 더 작아집니다.

연구 커뮤니케이션을 위한 R 노트북

다음 단계는 이 항목이 중요한 이유를 입력할 수 있는 소개를 수행하는 것입니다 . 예를 들어, 우리는 CD-ROM이 차선책이라고 말할 수 있습니다. 소비자 보고서를 작성하거나 마케팅 부서에서 근무하는 경우 어떤 기능이 정말 중요한지 또는 소비자가 찾고 있는 것이 무엇인지 파악하려고 합니다.

R 패키지를 호출하고 시작할 것입니다. 여기서 내가 좋아하는 한 가지 좋은 점은 R Notebook에서 실제로 HTML을 사용할 수 있다는 것입니다. 예를 들어 우리 자신에게 코멘트를 남기고 싶다면 다음과 같이 할 수 있습니다.

연구 커뮤니케이션을 위한 R 노트북

이것을 저장하면 전혀 나타나지 않습니다. 그래서 우리는 이것을 본문에 우리 자신에 대한 주석으로 남겨두었습니다. 이것은 MS Word와 같은 곳에서 우리가 할 수 있기를 바라는 것입니다.

R 노트북의 패키지 소개

다음 단계는 여기에서 이 코드 플롯을 사용하고 몇 가지 설정을 추가하는 것입니다. Python과 SQL을 사용할 수 있지만 이 예에서는 R을 사용합니다.

우리는 필요한 모든 패키지를 읽을 것입니다. 컴퓨터에 이러한 프로그램이 없으면 설치해야 할 수 있습니다.

연구 커뮤니케이션을 위한 R 노트북

다시 말하지만 이것은 전체 보고서가 아닙니다. R Markdown에 대해 알아야 할 몇 가지 사항을 보여주기 위해 뼈대를 살펴보겠습니다.

이제 데이터를 얻는 위치와 데이터를 중요하게 만드는 요소를 소개하겠습니다. 이 경우 우리의 출처는 Journal of Applied Econometrics라고 말할 수 있습니다. 이 별표 작업을 수행하면 이탤릭체로 바뀝니다.

연구 커뮤니케이션을 위한 R 노트북

그런 다음 Excel에서 파일을 읽고 R을 사용하여 가져옵니다. 보시다시피 데이터가 이미 꽤 좋아 보입니다. 이는 R 노트북의 또 다른 멋진 점입니다.

연구 커뮤니케이션을 위한 R 노트북

출력 형식에 따라 이것이 나타날 수도 있습니다. HTML을 사용하는 경우 사용자는 실제로 데이터를 훑어보고 기본적인 상호 작용을 할 수 있습니다. 실제 문서에서 이러한 작업을 수행할 수 있다는 것이 정말 좋습니다.

연구 커뮤니케이션을 위한 R 노트북

R 노트북에서 동적 참조 추가

이제 데이터 텍스트에 동적 참조를 포함하고 싶다고 가정해 보겠습니다. 보고서를 작성할 때마다 이것이 동일하지 않을 수 있기 때문에 정기적으로 업데이트되기를 원합니다. 맞습니까? 그래서 우리는 텍스트에서 바로 여기 라인에 동적 참조를 만들 것입니다.

이러한 모든 코드에 대한 치트 시트 및 참조 가이드가 있습니다. 도움말로 이동하여 R Markdown에 대한 항목을 선택하면 다양한 설정을 모두 찾아볼 수 있습니다. 많이 있고 대신 이것을 사용할 수 있기 때문에 외울 가치가 없을 것입니다.

연구 커뮤니케이션을 위한 R 노트북

R 청크를 다시 삽입하고 FALSE , nrowsncols 를 포함합니다 .

연구 커뮤니케이션을 위한 R 노트북

이것이 실행되고 실행되면 R 환경으로 이동하여 객체로 바뀌었는지 확인할 수도 있습니다.

연구 커뮤니케이션을 위한 R 노트북

좋은 또 다른 점은 아이디어를 던지고 실제로 어떻게 보일지 알고 싶다면 하단에 있는 콘솔을 사용할 수 있다는 것입니다. 콘솔에서 실행하고 출력이 어떻게 보이는지 확인할 수 있습니다.

연구 커뮤니케이션을 위한 R 노트북

뷰어 창으로 돌아갑니다. 이제 이 섹션은 보고서에 전혀 표시되지 않습니다. 일부 객체를 사용하고 싶지만 코드를 표시하고 싶지 않은 경우 유용합니다.

연구 커뮤니케이션을 위한 R 노트북

우리는 nrows 및 ncols에서 이러한 백 텍스트를 사용하여 동적으로 유지합니다. PDF 보고서가 있고 이러한 숫자를 매주 하드 코딩하는 대신 자동으로 변경해야 하는 경우 이러한 인라인 참조를 사용할 수 있습니다.

연구 커뮤니케이션을 위한 R 노트북

데이터를 다시 탐색하고 컴퓨터 가격을 확인하는 중입니다.

연구 커뮤니케이션을 위한 R 노트북

이 코드를 실행하면 모든 형식이 잘 지정된 설명 통계를 볼 수 있습니다. 데이터 크기에 따라 파일 크기에 매우 민감하게 반응합니다.

연구 커뮤니케이션을 위한 R 노트북

결론

이 자습서에서는 재현 가능한 연구를 개발하고 R 노트북을 사용하여 연구 결과를 전달하는 프로세스를 간소화하는 것의 중요성에 대해 논의했습니다. 이렇게 하면 원본 결과를 빠르고 쉽게 재현하고 역추적하여 파생된 방법을 확인할 수 있습니다. 

이 시리즈의 2부에서 이 자습서가 계속되는 것을 주의하십시오.

조지 마운트


파이썬에서 자기란 무엇인가: 실제 사례

파이썬에서 자기란 무엇인가: 실제 사례

파이썬에서 자기란 무엇인가: 실제 사례

R에서 RDS 파일을 저장하고 로드하는 방법

R에서 RDS 파일을 저장하고 로드하는 방법

R의 .rds 파일에서 개체를 저장하고 로드하는 방법을 배웁니다. 이 블로그에서는 R에서 LuckyTemplates로 개체를 가져오는 방법도 다룹니다.

첫 N 영업일 재방문 – DAX 코딩 언어 솔루션

첫 N 영업일 재방문 – DAX 코딩 언어 솔루션

이 DAX 코딩 언어 자습서에서는 GENERATE 함수를 사용하는 방법과 측정값 제목을 동적으로 변경하는 방법을 알아봅니다.

LuckyTemplates에서 다중 스레드 동적 시각적 개체 기술을 사용한 인사이트 쇼케이스

LuckyTemplates에서 다중 스레드 동적 시각적 개체 기술을 사용한 인사이트 쇼케이스

이 자습서에서는 다중 스레드 동적 시각적 개체 기술을 사용하여 보고서의 동적 데이터 시각화에서 통찰력을 만드는 방법을 다룹니다.

LuckyTemplates의 컨텍스트 필터링 소개

LuckyTemplates의 컨텍스트 필터링 소개

이 기사에서는 필터 컨텍스트를 살펴보겠습니다. 필터 컨텍스트는 모든 LuckyTemplates 사용자가 처음에 배워야 하는 주요 주제 중 하나입니다.

LuckyTemplates 온라인 서비스에서 앱을 사용하기 위한 최고의 팁

LuckyTemplates 온라인 서비스에서 앱을 사용하기 위한 최고의 팁

LuckyTemplates Apps 온라인 서비스가 다양한 소스에서 생성된 다양한 보고서 및 인사이트를 관리하는 데 어떻게 도움이 되는지 보여주고 싶습니다.

시간 경과에 따른 이익 마진 변화 분석 - LuckyTemplates 및 DAX를 사용한 분석

시간 경과에 따른 이익 마진 변화 분석 - LuckyTemplates 및 DAX를 사용한 분석

LuckyTemplates에서 측정 분기 및 DAX 수식 결합과 같은 기술을 사용하여 수익 마진 변경을 해결하는 방법을 알아봅니다.

DAX Studio의 데이터 캐시에 대한 구체화 아이디어

DAX Studio의 데이터 캐시에 대한 구체화 아이디어

이 자습서에서는 데이터 캐시의 구체화 아이디어와 결과 제공 시 DAX 성능에 미치는 영향에 대해 설명합니다.

LuckyTemplates를 사용한 비즈니스 보고

LuckyTemplates를 사용한 비즈니스 보고

지금까지 Excel을 계속 사용하고 있다면 지금이 비즈니스 보고 요구 사항에 LuckyTemplates를 사용하기 시작하는 가장 좋은 시기입니다.

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것

LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것