파이썬에서 자기란 무엇인가: 실제 사례
파이썬에서 자기란 무엇인가: 실제 사례
이 블로그 게시물에서는 R 노트북을 사용하여 연구를 전달하고 그 결과를 제시하는 방법을 살펴보겠습니다. 이 자습서에서 얻을 수 있는 내용이 R 노트북을 사용하여 모든 종류의 연구 결과를 보고하고 전달할 수 있는 프레임워크가 되기를 바랍니다.
특히 재현 가능한 연구 아이디어와 관련하여 이렇게 하면 몇 가지 큰 이점이 있습니다 . 이것이 의미하는 바와 R 노트북에서 이를 수행하는 방법에 대해 논의할 것입니다.
목차
재현성이란 무엇입니까?
재현성이라는 아이디어는 누구든지 당신이 발견한 것을 감사할 수 있고 당신이 사용한 입력과 프로세스가 주어지면 모든 것을 검토할 수 있어야 한다는 것입니다. 이것이 우리의 데이터 분석 요구 사항에 적용되는 몇 가지 방법이 있습니다. 즉, 사물을 재현할 수 있는 환경, 기여한 내용을 사람들이 볼 수 있도록 하는 환경, 파일을 쉽게 감사할 수 있고 재현 가능한 게시자가 있는 것입니다.
이상적으로는 누군가가 보고서에 도달한 방법과 사용한 플롯 또는 테이블이 생성된 방법을 정확하게 볼 수 있으므로 모든 것이 완전히 재현 가능한 환경에 있습니다.
이제 LuckyTemplates 또는 Excel 과 같은 것이 여기에 어떻게 부합하는지 궁금할 것입니다 . 이 재현 가능한 작업 흐름의 중간에 있다고 말할 수 있습니다. 특히 파워 쿼리 에 대해 생각할 때 재현성이 매우 뛰어납니다. 관련된 프로세스를 보는 것이 매우 분명한 적용 단계를 생각해 보십시오 .
시각화 및 보고서와 관련하여 상황이 조금 더 복잡해지는 부분입니다. R 노트북은 RStudio의 일부입니다. LuckyTemplates 포털에는 시작하고 실행할 수 있는 과정이 있습니다. 특히 이 특히 R Markdown 및 R Notebooks 에 대한 이야기입니다.
따라서 Jupyter 노트북 에 익숙하다면 연구를 위한 스토리텔링 문서를 만들기 위해 텍스트와 코드를 배치할 수 있다는 아이디어가 떠오를 것입니다.
우리는 이러한 결과를 다양한 출력으로 렌더링할 수 있습니다. PDF를 생성하거나 HTML로 렌더링해야 하는 경우 R Notebooks를 다양한 파일 형식에 사용할 수 있습니다.
시작하려면 R 노트북을 열고 RStudio에서 파일, 새 파일, R 노트북으로 이동합니다. 우리는 다음과 같은 매우 간단한 연구 질문으로 리소스의 이전 데이터 세트로 작업할 것입니다.
컴퓨터의 가격은 CD-ROM이 있는지 여부에 따라 달라집니까?
이 질문은 구식이지만 우리 모두는 어딘가에서 시작해야 합니다. 우리는 또한 연구 보고서의 뼈대를 놓고 이 기본 프레임워크를 사용하여 연구 결과를 제시할 것입니다.
RStudio에서 이와 같은 것을 보게 될 것입니다. 이것은 R 마크다운 파일 확장자인 .rmd 파일이라고 하는 것입니다. 특히 익숙하지 않은 경우 약간 거슬릴 수 있지만 세련된 최종 제품을 미리 볼 수 있는 방법이 있습니다.
노트북의 이 부분은 YAML 파일이라는 메타데이터입니다.
그 섹션 뒤에는 코드가 들어갈 백 텍스트가 있습니다. 그런 다음 R Markdown을 사용하는 문서의 텍스트 부분이 있습니다 . 이전에 Markdown을 사용한 적이 있다면 R markdown은 매우 유사합니다. 별표 및 해시 기호와 같은 것을 사용하여 텍스트를 표시하고 렌더링할 수 있습니다.
R Studio 및 R Notebooks로 이동한 다음 이 분석을 함께 살펴보겠습니다. 톱니바퀴를 클릭하고 Viewer Pane에서 미리보기 로 표시되는지 확인합니다 .
R 노트북 시작하기
미리보기 버튼을 클릭하면 저장하라는 메시지가 표시됩니다. 다시 말하지만 이것은 RMD 파일이므로 먼저 저장해야 합니다. 왼쪽 창에서 렌더링된 출력을 볼 수 있습니다. 이제 여기에서 무언가를 변경하고 Computers analysis 와 같은 말을 하고 George Mount 와 같은 저자 이름을 추가하려면 따옴표로 묶어야 합니다.
Save 를 클릭하면 자동으로 업데이트됩니다.
그래서 이것으로 놀자. 여기에는 이미 몇 개의 자리 표시자가 있습니다. 괜찮습니다. 가장 먼저 할 일은 "CD-ROM이 판매 가격에 영향을 줍니까?"를 입력하는 것입니다. 이것을 저장하면 Header1이 됩니다. 그러나 이것을 두 개의 해시 마크로 바꾸면 Header2로 바뀌고 더 작아집니다.
다음 단계는 이 항목이 중요한 이유를 입력할 수 있는 소개를 수행하는 것입니다 . 예를 들어, 우리는 CD-ROM이 차선책이라고 말할 수 있습니다. 소비자 보고서를 작성하거나 마케팅 부서에서 근무하는 경우 어떤 기능이 정말 중요한지 또는 소비자가 찾고 있는 것이 무엇인지 파악하려고 합니다.
R 패키지를 호출하고 시작할 것입니다. 여기서 내가 좋아하는 한 가지 좋은 점은 R Notebook에서 실제로 HTML을 사용할 수 있다는 것입니다. 예를 들어 우리 자신에게 코멘트를 남기고 싶다면 다음과 같이 할 수 있습니다.
이것을 저장하면 전혀 나타나지 않습니다. 그래서 우리는 이것을 본문에 우리 자신에 대한 주석으로 남겨두었습니다. 이것은 MS Word와 같은 곳에서 우리가 할 수 있기를 바라는 것입니다.
R 노트북의 패키지 소개
다음 단계는 여기에서 이 코드 플롯을 사용하고 몇 가지 설정을 추가하는 것입니다. Python과 SQL을 사용할 수 있지만 이 예에서는 R을 사용합니다.
우리는 필요한 모든 패키지를 읽을 것입니다. 컴퓨터에 이러한 프로그램이 없으면 설치해야 할 수 있습니다.
다시 말하지만 이것은 전체 보고서가 아닙니다. R Markdown에 대해 알아야 할 몇 가지 사항을 보여주기 위해 뼈대를 살펴보겠습니다.
이제 데이터를 얻는 위치와 데이터를 중요하게 만드는 요소를 소개하겠습니다. 이 경우 우리의 출처는 Journal of Applied Econometrics라고 말할 수 있습니다. 이 별표 작업을 수행하면 이탤릭체로 바뀝니다.
그런 다음 Excel에서 파일을 읽고 R을 사용하여 가져옵니다. 보시다시피 데이터가 이미 꽤 좋아 보입니다. 이는 R 노트북의 또 다른 멋진 점입니다.
출력 형식에 따라 이것이 나타날 수도 있습니다. HTML을 사용하는 경우 사용자는 실제로 데이터를 훑어보고 기본적인 상호 작용을 할 수 있습니다. 실제 문서에서 이러한 작업을 수행할 수 있다는 것이 정말 좋습니다.
R 노트북에서 동적 참조 추가
이제 데이터 텍스트에 동적 참조를 포함하고 싶다고 가정해 보겠습니다. 보고서를 작성할 때마다 이것이 동일하지 않을 수 있기 때문에 정기적으로 업데이트되기를 원합니다. 맞습니까? 그래서 우리는 텍스트에서 바로 여기 라인에 동적 참조를 만들 것입니다.
이러한 모든 코드에 대한 치트 시트 및 참조 가이드가 있습니다. 도움말로 이동하여 R Markdown에 대한 항목을 선택하면 다양한 설정을 모두 찾아볼 수 있습니다. 많이 있고 대신 이것을 사용할 수 있기 때문에 외울 가치가 없을 것입니다.
R 청크를 다시 삽입하고 FALSE , nrows 및 ncols 를 포함합니다 .
이것이 실행되고 실행되면 R 환경으로 이동하여 객체로 바뀌었는지 확인할 수도 있습니다.
좋은 또 다른 점은 아이디어를 던지고 실제로 어떻게 보일지 알고 싶다면 하단에 있는 콘솔을 사용할 수 있다는 것입니다. 콘솔에서 실행하고 출력이 어떻게 보이는지 확인할 수 있습니다.
뷰어 창으로 돌아갑니다. 이제 이 섹션은 보고서에 전혀 표시되지 않습니다. 일부 객체를 사용하고 싶지만 코드를 표시하고 싶지 않은 경우 유용합니다.
우리는 nrows 및 ncols에서 이러한 백 텍스트를 사용하여 동적으로 유지합니다. PDF 보고서가 있고 이러한 숫자를 매주 하드 코딩하는 대신 자동으로 변경해야 하는 경우 이러한 인라인 참조를 사용할 수 있습니다.
데이터를 다시 탐색하고 컴퓨터 가격을 확인하는 중입니다.
이 코드를 실행하면 모든 형식이 잘 지정된 설명 통계를 볼 수 있습니다. 데이터 크기에 따라 파일 크기에 매우 민감하게 반응합니다.
결론
이 자습서에서는 재현 가능한 연구를 개발하고 R 노트북을 사용하여 연구 결과를 전달하는 프로세스를 간소화하는 것의 중요성에 대해 논의했습니다. 이렇게 하면 원본 결과를 빠르고 쉽게 재현하고 역추적하여 파생된 방법을 확인할 수 있습니다.
이 시리즈의 2부에서 이 자습서가 계속되는 것을 주의하십시오.
조지 마운트
파이썬에서 자기란 무엇인가: 실제 사례
R의 .rds 파일에서 개체를 저장하고 로드하는 방법을 배웁니다. 이 블로그에서는 R에서 LuckyTemplates로 개체를 가져오는 방법도 다룹니다.
이 DAX 코딩 언어 자습서에서는 GENERATE 함수를 사용하는 방법과 측정값 제목을 동적으로 변경하는 방법을 알아봅니다.
이 자습서에서는 다중 스레드 동적 시각적 개체 기술을 사용하여 보고서의 동적 데이터 시각화에서 통찰력을 만드는 방법을 다룹니다.
이 기사에서는 필터 컨텍스트를 살펴보겠습니다. 필터 컨텍스트는 모든 LuckyTemplates 사용자가 처음에 배워야 하는 주요 주제 중 하나입니다.
LuckyTemplates Apps 온라인 서비스가 다양한 소스에서 생성된 다양한 보고서 및 인사이트를 관리하는 데 어떻게 도움이 되는지 보여주고 싶습니다.
LuckyTemplates에서 측정 분기 및 DAX 수식 결합과 같은 기술을 사용하여 수익 마진 변경을 해결하는 방법을 알아봅니다.
이 자습서에서는 데이터 캐시의 구체화 아이디어와 결과 제공 시 DAX 성능에 미치는 영향에 대해 설명합니다.
지금까지 Excel을 계속 사용하고 있다면 지금이 비즈니스 보고 요구 사항에 LuckyTemplates를 사용하기 시작하는 가장 좋은 시기입니다.
LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것