파이썬에서 자기란 무엇인가: 실제 사례
파이썬에서 자기란 무엇인가: 실제 사례
클래스 폭은 데이터를 빈도표로 구성할 때 필수적인 구성 요소입니다. 각 클래스 또는 범주의 값 범위를 결정하는 데 도움이 됩니다.
Excel에서 클래스 너비를 찾으려면 공식 (Max – Min) / n을 사용합니다.
Max는 데이터 세트의 최대값입니다.
Min은 데이터 세트의 최소값입니다.
n은 클래스 수입니다.
Excel은 클래스 너비를 쉽게 계산할 수 있도록 다양한 기능을 제공합니다. MAX 및 MIN 함수는 데이터 세트에서 가장 높은 값과 가장 낮은 값을 결정합니다.
이 기사의 간단한 수학 공식과 이러한 함수를 결합하면 곧 도수 분포표를 빠르게 만들 수 있습니다.
갑시다!
목차
클래스 너비와 Excel에서의 중요성 이해
클래스 너비는 데이터 세트에서 간격 또는 클래스의 크기를 나타냅니다. 클래스 너비를 계산하는 세 가지 광범위한 단계가 있습니다.
최대값에서 최소값을 빼서 데이터 세트의 범위를 찾습니다.
도수 분포에서 원하는 클래스(n) 수를 결정합니다.
범위를 클래스 수(n)로 나눕니다.
빈도 분포 및 그래프에서 클래스 폭의 역할
클래스 폭은 도수 분포표와 히스토그램과 같은 데이터의 그래픽 표현을 만드는 데 중요한 역할을 합니다.
빈도 분포는 데이터를 클래스로 구성하고 각 클래스가 발생하는 빈도를 표시합니다.
클래스 폭이 빈도 분포에 영향을 미치는 세 가지 방법이 있습니다.
다른 클래스 폭을 선택하면 데이터의 다양한 추세 또는 패턴을 강조 표시할 수 있습니다.
클래스 너비를 미리 정의하면 다양한 데이터 세트를 일관되고 공정하게 비교할 수 있습니다.
적절한 클래스 너비는 데이터를 더 잘 이해하는 데 도움이 됩니다.
클래스 수와 해당 클래스 너비를 선택하는 것은 단순성과 세분성 간의 절충점이라는 점을 명심하십시오.
클래스가 너무 적으면 데이터가 지나치게 단순화될 수 있고 클래스가 너무 많으면 패턴과 추세를 식별하기 어려울 수 있습니다.
클래스 너비의 역할과 데이터 분석에서의 역할에 대해 살펴보았으므로 이제 다음 섹션에서 클래스 너비를 계산하기 위해 데이터를 준비하는 방법을 살펴보겠습니다.
Excel에서 데이터 세트를 준비하는 2단계
Excel에서 클래스 너비를 계산하기 전에 데이터 세트를 준비하는 것이 중요합니다. 데이터 준비에는 두 단계가 있습니다.
원시 데이터를 Excel로 가져옵니다.
데이터를 정렬하고 구성합니다.
1. 원시 데이터를 가져오는 방법
외부 파일에서 Excel로 원시 데이터를 가져오려면 다음과 같은 간단한 단계를 따르십시오.
새 Excel 통합 문서를 엽니다.
데이터세트를 시작하려는 셀(예: A1)을 클릭합니다.
데이터 탭에서 '외부 데이터 가져오기' 또는 '외부 데이터 가져오기'를 선택합니다.
데이터가 포함된 파일을 찾아서 스프레드시트로 가져옵니다.
모든 데이터 요소(데이터 집합을 나타내는 점수 또는 값)가 별도의 셀에 있는지 확인합니다.
2. 데이터 정렬 및 구성 방법
원시 데이터가 Excel에 있으면 계산 및 분석을 쉽게 하기 위해 정렬 및 구성이 필수적입니다. 데이터를 정렬하는 방법은 다음과 같습니다.
데이터 세트 내의 아무 셀이나 클릭하여 활성화하십시오.
'데이터' 탭으로 이동하여 '정렬'을 클릭합니다.
데이터 포인트(점수)를 나타내는 열을 선택하고 '내림차순 정렬' 또는 '내림차순 정렬'을 선택합니다.
'확인'을 클릭합니다. 이제 Excel에서 기본 설정에 따라 데이터 세트를 오름차순 또는 내림차순으로 구성합니다.
데이터를 더 잘 이해하기 위해 다음 구성 단계를 고려할 수 있습니다.
나중에 클래스 너비를 정의할 클래스 또는 빈으로 데이터 요소를 분류합니다.
조건부 서식을 사용하여 데이터 세트 내의 특정 값이나 패턴을 강조 표시합니다.
Excel에서 테이블 구조를 만들어 데이터를 쉽게 필터링, 분석 및 시각화하세요.
원시 데이터를 가져오고 정렬하고 구성하면 이제 클래스 너비를 계산하고 Excel에서 데이터 세트를 추가로 분석할 준비가 되었습니다.
샘플 데이터
이 문서에서는 설문 조사 참가자의 연령을 나타내는 샘플 데이터를 사용합니다.
참가자들의 나이는 18, 21, 30, 35, 42, 48, 55, 62, 70, 75세입니다.
따라 하려면 이 값을 새 스프레드시트의 A열에 복사하고 오름차순으로 정렬합니다 .
Excel에서 클래스 너비를 계산하는 방법
다음은 세 가지 광범위한 단계입니다.
데이터 세트의 최소값과 최대값을 찾습니다.
수업 수를 결정하십시오.
클래스 너비 공식을 적용합니다.
Excel에서 예제를 통해 작업해 보겠습니다.
1. 최소값과 최대값 찾기
Excel에서는 다음 단계와 함께 MIN 및 MAX 함수를 사용할 수 있습니다.
빈 셀을 선택하고 =MIN(range) 를 입력합니다 . 여기서 범위는 데이터를 포함하는 셀의 범위입니다.
최소값을 얻으려면 Enter 키를 누르십시오.
다른 빈 셀을 선택하고 =MAX(range) 를 입력합니다 .
최대 값을 얻으려면 Enter 키를 누르십시오.
이 그림은 샘플 데이터에 대한 계산을 보여줍니다. 최소 연령은 18세이고 최대 연령은 75세입니다.
2. 클래스 수 결정
다음으로 데이터를 분류하기 위한 클래스 수(n)를 결정해야 합니다.
한 가지 일반적인 방법은 Sturges' Rule을 사용하는 것입니다 . 도수분포표나 히스토그램을 만들 때 사용할 클래스나 카테고리의 수를 결정하기 위한 지침입니다. 1926년 Herbert A. Sturges 가 제안했습니다 .
규칙은 다음과 같습니다.
n = 1 + 3.3 * log10(N) 여기서 N은 데이터 포인트의 수입니다.
이를 Excel에 적용하려면 다음을 수행하십시오.
빈 셀을 선택하고 =1+3.3*LOG10(count(range))를 입력하여 범위를 데이터 범위로 바꿉니다.
=CEILING(value,1)을 사용하여 결과를 반올림합니다. 여기서 value는 1단계의 결과가 포함된 셀입니다.
셀 A2에서 A11까지의 연령 샘플을 사용하면 공식은 다음과 같습니다.
= 1 + 3.3 *LOG10(횟수(A2:A11))
결과는 4.2이며 5로 반올림됩니다. 이 그림은 CEILING 함수와 결합된 수식을 보여줍니다.
3. 클래스 너비 공식 적용
Now you have the necessary values to calculate the class width. Use the formula:
Class Width = (Max – Min) / n
In Excel, select an empty cell and type =(max-min)/n
Replace Max with the cell containing the maximum value.
Replace Min with the cell containing the minimum value.
Replace n with the cell containing the number of classes.
You can then round up the result using =CEILING(value, 1).
Using the sample data in the picture below, the formula is:
=CEILING((D3-D2)/D5, 1)
The result with our sample data rounds up to a class width of 12.
With these values, you can now create a frequency distribution table or histogram using intervals of the calculated class width, which is what we’re going to cover in the next section.
How to Create a Frequency Distribution Table
도수 분포표를 만들기 위한 다음 단계는 다음과 같습니다.
상한선과 하한선을 설정합니다.
클래스 중간점을 찾습니다.
각 클래스에 대한 빈도를 만듭니다.
그것을 분해합시다.
1. 클래스 경계 설정
첫 번째 클래스 경계를 생성하려면 다음을 수행하십시오.
데이터 세트에서 가장 낮은 값부터 시작합니다.
클래스 너비를 추가하여 첫 번째 클래스 간격의 상한 경계를 만듭니다.
다음 클래스 간격에 대해 클래스 너비를 매번 추가하는 하한 및 상한 경계에 대한 연속 값을 사용합니다.
샘플 데이터에서 최소 연령은 18세입니다. 상한선은 30세(18세 + 12세)이므로 첫 번째 클래스는 18-30세입니다.
다음은 5가지 클래스 경계(하한 및 상한)입니다.
1등급: 18-30세(18-29세 포함)
2등급: 30~42세(30~41세 대상)
3등급: 42~54세(42~53세 포함)
4등급: 54-66세(54-65세 포함)
클래스 5: 66-78(66-77세 포함)
2. 클래스 중간점 찾기
클래스 중간점은 도수 분포에서 각 클래스의 중심점입니다. 각 클래스의 클래스 중간점을 계산하려면 다음 공식을 사용할 수 있습니다.
중간점 = (하한 + 상한) / 2
이 공식을 사용하여 도수 분포표의 중간점 열을 각 클래스 간격에 대해 계산된 중간점으로 채웁니다.
연속 수업의 중간 지점은 다음과 같습니다.
클래스 1 중간점: (18 + 30) / 2 = 24
클래스 2 중간점: (30 + 42) / 2 = 36
클래스 3 중간점: (42 + 54) / 2 = 48
클래스 4 중간점: (54 + 66) / 2 = 60
클래스 5 중간점: (66 + 78) / 2 = 72
3. 각 클래스의 빈도 계산
Excel에서는 FREQUENCY 함수를 사용하여 각 클래스 간격의 빈도를 계산할 수 있습니다. 구문은 다음과 같습니다.
=FREQUENCY(data_array, bins_array)
data_array는 데이터 세트의 범위입니다.
bins_array는 상위 경계의 범위입니다.
다음과 같이하세요:
표의 수업 간격 수와 동일한 범위를 선택하고 수식을 입력합니다.
각 클래스 간격에 대한 빈도를 표시하려면 Ctrl+Shift+Enter를 누르십시오.
빈도 분포표에 빈도 값을 추가합니다.
이 그림은 B열에 있는 5개 클래스의 상위 경계가 있는 샘플 데이터를 보여줍니다.
이 수식은 셀 C1에 입력되었습니다.
=주파수(A2:A11, B2:B6)
다음 단계는 Ctrl+Shift+Enter를 눌러 수식을 배열 수식으로 입력하는 것입니다.
Excel은 배열 수식임을 나타내기 위해 수식을 중괄호 {}로 묶습니다.
안전하게 무시할 수 있는 빈도가 0인 추가 범주를 얻을 수 있습니다. Excel FREQUENCY 함수는 또한 가장 높은 상한값과 정확히 같은 값을 찾습니다.
샘플 데이터에는 최종 상한과 같은 값이 없으므로 제로 빈도의 추가 범주가 생성됩니다.
이제 도수 분포표를 만들었으므로 다음 섹션에서 Excel에서 표를 시각화할 수 있는 방법을 살펴보겠습니다.
주파수 분포를 시각화하는 방법
Excel에서 빈도 분포를 시각화하려면 먼저 빈도표를 기반으로 그래프를 만들어야 합니다.
다음과 같이하세요:
클래스에 대한 열과 해당 빈도에 대한 다른 열이 있는 2열 테이블로 데이터를 구성합니다.
열 머리글을 포함하여 전체 데이터 범위를 선택합니다.
Excel 도구 모음에서 삽입 탭으로 이동합니다.
도구 모음의 차트 그룹에서 기둥형 차트 또는 막대형 차트와 같이 데이터에 적합한 그래프 유형을 선택합니다.
스프레드시트에 그래프를 삽입하려면 차트 유형을 클릭하십시오.
샘플 데이터의 경우 Excel에서 최상의 선택을 결정하도록 "권장 차트" 옵션을 클릭했습니다.
Excel은 히스토그램에 꼭 필요한 Clustered Column 막대 차트를 선택했습니다.
차트를 생성한 후에 는 덮어쓰지 않도록 데이터를 구성하는 셀을 잠글 수 있습니다 .
그래프를 사용자 정의하는 방법
Excel에서 사용할 수 있는 제목, 색, 글꼴 또는 기타 서식 옵션을 변경하여 차트의 모양을 추가로 사용자 지정할 수도 있습니다.
다음 단계를 따르십시오 .
Excel 도구 모음에서 차트 디자인 및 형식 탭을 활성화하려면 그래프를 클릭하십시오.
차트 디자인 탭을 사용하여 차트 레이아웃 또는 스타일을 변경하고, 차트 제목을 추가하고, 축 제목이나 데이터 레이블을 수정합니다.
형식 탭을 활용하여 그래프 내 요소의 색 구성표 또는 형식을 조정합니다.
그래프 크기를 조정하고 최적의 인쇄 출력을 위해 인쇄 영역을 설정할 수도 있습니다 .
분포 그래프 분석을 위한 3가지 팁
다음은 분포 그래프를 분석하기 위한 세 가지 팁입니다.
왜곡이나 대칭과 같은 분포의 경향이나 패턴을 식별하기 위해 그래프의 모양을 검사합니다.
각 열 또는 막대의 높이를 보고 각 클래스의 상대적 빈도를 확인합니다.
빈도 분포의 범위와 클래스 폭을 평가하려면 가로축에 주의를 기울이십시오.
이러한 단계를 따르고 그래프의 기능을 고려하면 Excel에서 도수 분포를 효과적으로 시각화하고 분석할 수 있습니다.
이를 통해 데이터를 기반으로 정보에 입각한 해석과 결정을 내릴 수 있습니다.
도수 분포표에 대한 추가 정보
LuckyTemplates를 사용하는 더 복잡한 예는 Excel에서 비율 및 빈도 테이블 사용 에 대한 이 문서를 확인하십시오 .
이 비디오는 빈도 및 분포 차트를 만드는 과정을 안내합니다.
마지막 생각들
클래스 폭을 찾고 Excel에서 도수 분포표를 만드는 것은 대규모 데이터 세트로 작업할 때 유용한 기술입니다.
Excel의 기본 제공 기능 및 차트 작성 도구를 활용하여 간단하고 효율적인 방식으로 빈도표를 분석하고 시각화하는 방법을 배웠습니다.
이를 통해 다른 방법으로는 식별하기 어려울 수 있는 데이터의 패턴과 경향을 식별할 수 있습니다.
이제 진정한 챔피언처럼 Excel에서 클래스 너비를 계산할 수 있습니다! 더 이상 데이터를 깔끔하고 관리하기 쉬운 클래스로 구성하는 방법에 대해 머리를 긁적일 필요가 없습니다.
Excel은 당신의 삶을 훨씬 더 쉽게 만들어 줄 숨겨진 보석으로 가득 찬 강국입니다. 그러니 여기서 멈추지 마세요! 계속 탐색하고 Excel에 대한 다른 가이드를 읽고 가장 중요한 것은 계속해서 재미있게 사용하는 것입니다.
데이터 여정에서 'Excel-lent' 진전을 이루는 방법은 다음과 같습니다!
파이썬에서 자기란 무엇인가: 실제 사례
R의 .rds 파일에서 개체를 저장하고 로드하는 방법을 배웁니다. 이 블로그에서는 R에서 LuckyTemplates로 개체를 가져오는 방법도 다룹니다.
이 DAX 코딩 언어 자습서에서는 GENERATE 함수를 사용하는 방법과 측정값 제목을 동적으로 변경하는 방법을 알아봅니다.
이 자습서에서는 다중 스레드 동적 시각적 개체 기술을 사용하여 보고서의 동적 데이터 시각화에서 통찰력을 만드는 방법을 다룹니다.
이 기사에서는 필터 컨텍스트를 살펴보겠습니다. 필터 컨텍스트는 모든 LuckyTemplates 사용자가 처음에 배워야 하는 주요 주제 중 하나입니다.
LuckyTemplates Apps 온라인 서비스가 다양한 소스에서 생성된 다양한 보고서 및 인사이트를 관리하는 데 어떻게 도움이 되는지 보여주고 싶습니다.
LuckyTemplates에서 측정 분기 및 DAX 수식 결합과 같은 기술을 사용하여 수익 마진 변경을 해결하는 방법을 알아봅니다.
이 자습서에서는 데이터 캐시의 구체화 아이디어와 결과 제공 시 DAX 성능에 미치는 영향에 대해 설명합니다.
지금까지 Excel을 계속 사용하고 있다면 지금이 비즈니스 보고 요구 사항에 LuckyTemplates를 사용하기 시작하는 가장 좋은 시기입니다.
LuckyTemplates 게이트웨이란? 당신이 알아야 할 모든 것