파이썬에서 자기란 무엇인가: 실제 사례
파이썬에서 자기란 무엇인가: 실제 사례
오늘은 R Notebook을 사용하여 연구를 전달하는 주제를 계속 다룰 것입니다. R을 사용하여 연구 결과를 전달하는 데 사용할 수 있는 기본 프레임워크에 대해 계속 작업할 것입니다. 재현 가능한 연구 전달 에 대한 이 시리즈의 첫 번째 부분은 여기에서 확인하십시오 .
목차
가설 세우기
보고서의 다음 단계는 가설을 세우는 것입니다 . 뷰어 창에 또 다른 섹션을 생성하고 상위 수준 보고서를 볼 수 있도록 다른 섹션을 축소합니다.
가설을 위해 CD-ROM이 있는 컴퓨터와 없는 컴퓨터의 판매 가격에는 차이가 없다고 씁니다.
R 노트북에서 메서드 만들기
해당 가설에 답하는 데 사용할 실제 기술을 다루는 방법 으로 이동합니다 . 어떤 종류의 추론 통계도 필요하지 않을 수 있습니다. 청중에 따라 이 시나리오에서 높은 수준의 연구 보고서를 작성하게 됩니다.
95% 신뢰 수준에서 샘플 테스트를 수행하고 가격 분포를 육안으로 검사한다고 말할 것입니다. 대략 정상이면 테스트를 진행합니다.
가설과 방법을 저장한 후 미리보기 탭 에서 HTML 파일 , PDF 문서 또는 Word 문서 로 렌더링할 수 있습니다 .
이것을 HTML로 보내면 렌더링 상자에서 볼 수 있습니다.
여기에 출력이 생성되었다고 표시되므로 파일 탐색기로 이동하여 이를 확인하겠습니다. HTML 파일에서 이 파일을 열면 미리보기 버튼에 있던 것과 정말 유사하게 보이는 것을 볼 수 있습니다.
이 시점에서 오류 메시지가 표시되지 않으며 사용자 정의할 여지도 있습니다. R Markdown 및 R Notebooks 와 함께 이러한 도구를 사용하여 전체 책이나 웹 사이트를 작성할 수도 있습니다 .
스크립트로 돌아가서 계속 진행하겠습니다. 사용할 방법과 결과를 기록합니다. 우리는 기본적으로 우리의 계획을 공개 소싱하고 있으며 단지 무엇이 붙어 있는지 확인하기 위해 벽에 물건을 던지지 않는다는 것을 분명히 하고 있습니다. 우리는 데이터에 접근할 때 즉흥적이지 않습니다. 우리는 실제로 계획이 있습니다.
다양한 시도를 해보는 것도 나름의 이점이 있겠죠? 그러나 이 접근 방식에서 우리는 의도적으로 "이것이 우리가 할 일이고 그 다음에는 그것을 할 것입니다."라고 말합니다.
R 노트북에서 기술 통계 작업
기술통계를 해봅시다 . 우리는 CD-ROM이 있거나 없는 각 그룹의 가격을 찾고자 합니다. 이를 수행할 수 있는 몇 가지 방법이 있습니다. 이 그룹 요약을 호출 하고 이 파이프 연산자를 가져올 것입니다. 파이프 연산자에 익숙하지 않은 경우 이전에 이야기한 리소스를 확인할 수 있습니다.
그런 다음 평균 가격 = 평균 가격을 찾기 위해 레코드를 요약 하고 계산 합니다 . 마지막으로 이 그룹 요약을 인쇄한 다음 실행합니다.
우리가 간다. 이제 테이블이 생겼습니다.
앞서 말했듯이 우리는 각 그룹에 얼마나 많은 관찰이 있고 평균 가격이 얼마인지 알고 싶습니다. 인라인 참조를 사용하여 완전히 동적으로 만들 수 있습니다.
그룹 요약을 수행하고 tidyverse 작업을 사용합니다 . 이 행을 필터링한 다음 이 값 중 하나를 가져와 여기 인라인 참조에서 실제로 렌더링할 항목으로 변환합니다.
저장 후 Preview Notebook 으로 이동하여 결과를 확인합니다.
R 노트북에서 시각화 구축
R은 시각화 기능으로 잘 알려져 있습니다. 시각화를 위해 ggplot 을 사용합니다 . X축에 가격을 입력한 다음 히스토그램을 만듭니다 . 또한 ggplot 에서 실제로 수행하기 쉬운 패싯에 대한 작은 배수를 생성합니다 .
여기에서 제목, 배경, 색상 등과 같은 많은 것을 변경할 수 있습니다. 이것을 저장하면 플롯을 볼 수 있습니다. 이것은 현재 대화형이 아니지만 R에서 대화형으로 만드는 많은 방법이 있습니다. 이 예에서는 정적 플롯만 수행합니다.
우리의 결과는 종형 곡선 분포처럼 보이는 것을 보여줍니다. 즉, 분석을 계속 진행해야 합니다.
T-테스트 결과를 실행하고 보고서에 연결합니다. 다른 R 청크를 추가하고 이름을 cd_test 로 지정합니다 . 지금 실행하면 결과에 많은 정보가 포함되어 개별 요소를 꺼내기가 매우 어려울 것입니다.
깔끔한 기능을 사용하여 이것을 표 형식으로 만들 것입니다. 깔끔한 cd_test를 수행하면 모든 것이 멋진 테이블 구조로 바뀝니다. 보고서에 실제로 표시하기 위해 이것을 인쇄할 수도 있습니다.
우리가 할 수 있는 또 다른 일은 하한 및 상한 신뢰 구간을 찾는 것입니다. 이 부분은 그냥 무대이기 때문에 보여드리고 싶지 않습니다.
전반적으로 라이브 및 동적 문서처럼 보이며 개별 데이터 포인트와 테이블을 복사하여 보고서에 붙여넣는 것보다 훨씬 낫습니다. 이것을 동료에게 보낼 수 있으며 이상적으로는 미리 보기를 클릭하여 수행한 작업을 확인하고 이를 기반으로 빌드할 수 있습니다.
결론으로 끝내기
보고서가 거의 끝나가고 있으므로 결론을 작성하겠습니다.
리소스를 표시하기 위해 여기에 부록을 포함할 수도 있습니다. 부록이 있어서 좋은 점은 이것을 누군가에게 제시하거나 보여주면 데이터 소스가 누구인지 또는 어떤 것이 어떻게 측정되었는지 물어볼 것입니다. 이것들은 모두 유효한 질문이며 리소스가 포함된 부록이 있으면 부록을 가리킬 수 있기 때문에 정말 도움이 됩니다.
이미지를 포함하고 대체 텍스트를 사용할 수도 있습니다 . 이것은 기본적으로 이미지가 보여주는 것을 설명하는 좋은 방법입니다. HTML 사용자인 경우 HTML을 사용하여 이 이미지를 삽입할 수 있습니다.
결론
이 자습서에서는 실제로 전체 보고서를 검토했습니다. 이것은 매우 대략적인 초안이지만 R Markdown을 사용하여 연구 보고서의 구조를 만들었습니다.
우리는 모든 것이 문서화되는 재현성에 대해 이야기하는 것으로 시작했습니다. R Markdown과 이 프레임워크를 사용하여 웹 사이트, 책, 블로그와 같은 것을 만들 수 있습니다. 분석가로서 구축해야 하는 거의 모든 종류의 제품은 RStudio를 사용하여 생성할 수 있습니다.
자세한 내용은 Advancing into Analytics 라는 책을 참조하십시오 . 이것은 Excel, Python 및 R을 사용한 데이터 분석 및 통계 분석에 대한 좋은 기본 소개입니다 . LuckyTemplates 사용자를 위한 R 과정도 있습니다 . 이 시리즈의 세 번째 과정도 어느 시점에서 볼 수 있습니다.
이 R Notebook 자습서에서 몇 가지 사항을 배웠기를 바라며 이러한 도구를 사용하는 방법을 보고 싶습니다.
조지 마운트
파이썬에서 자기란 무엇인가: 실제 사례
R의 .rds 파일에서 개체를 저장하고 로드하는 방법을 배웁니다. 이 블로그에서는 R에서 LuckyTemplates로 개체를 가져오는 방법도 다룹니다.
이 DAX 코딩 언어 자습서에서는 GENERATE 함수를 사용하는 방법과 측정값 제목을 동적으로 변경하는 방법을 알아봅니다.
이 자습서에서는 다중 스레드 동적 시각적 개체 기술을 사용하여 보고서의 동적 데이터 시각화에서 통찰력을 만드는 방법을 다룹니다.
이 기사에서는 필터 컨텍스트를 살펴보겠습니다. 필터 컨텍스트는 모든 LuckyTemplates 사용자가 처음에 배워야 하는 주요 주제 중 하나입니다.
LuckyTemplates Apps 온라인 서비스가 다양한 소스에서 생성된 다양한 보고서 및 인사이트를 관리하는 데 어떻게 도움이 되는지 보여주고 싶습니다.
LuckyTemplates에서 측정 분기 및 DAX 수식 결합과 같은 기술을 사용하여 수익 마진 변경을 해결하는 방법을 알아봅니다.
이 자습서에서는 데이터 캐시의 구체화 아이디어와 결과 제공 시 DAX 성능에 미치는 영향에 대해 설명합니다.
지금까지 Excel을 계속 사용하고 있다면 지금이 비즈니스 보고 요구 사항에 LuckyTemplates를 사용하기 시작하는 가장 좋은 시기입니다.
LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것