Chi-Square-test in Excel: variabelen vergelijken

Chi-Square-test in Excel: variabelen vergelijken

In dit bericht laten we je zien hoe je de Chi-kwadraat-test in Excel kunt gebruiken om variabelen te vergelijken. Je kunt de volledige video van deze tutorial onderaan deze blog bekijken .

De Chi-kwadraattoets van onafhankelijkheid heeft twee categorische variabelen. We zullen uitzoeken of er een verband is tussen die variabelen.

We zullen het hypothesetoetsingskader gebruiken. Als u hier niet bekend mee bent, bekijk dan het  boek Advancing Into Analytics  . Dit is een geavanceerde analysetechniek die gebruikmaakt van Excel , R en Python.

Voor onze demo gaan we gebruik maken van een woningdataset in Excel. We moeten de werkelijke waarden verkrijgen met behulp van de draaitabel en deze vervolgens vergelijken met de verwachte waarden met behulp van formules.

We kijken ook naar het significantieniveau van 95% en of er een relatie is tussen de airconditioning en de voorkeursruimte.

Inhoudsopgave

Chi-kwadraattest gebruiken in Excel om variabelen te vergelijken

Laten we naar Excel springen. Dit zijn de huizenprijzen die uit het Journal of Applied Econometrics kwamen.

Chi-Square-test in Excel: variabelen vergelijken

Voeg een draaitabel in en klik op  OK om een ​​indexkolom te gebruiken om waarnemingen te tellen.

Chi-Square-test in Excel: variabelen vergelijken

Sleep vanuit de draaitabelvelden ' id '  naar het gedeelte Waarden. Selecteer  Aantal  in de waardeveldinstellingen, aangezien dit allemaal unieke waarden zijn. 

Vervolgens sleept u ' prefarea ' naar Kolommen en vervolgens sleept u ' airco ' naar Rijen om de werkelijke waarden te zien.

We hebben in totaal 546 waarnemingen. De 298 zijn geen airconditioning en ook geen voorkeursruimte, terwijl de 53 beide zijn, enzovoort.

Chi-Square-test in Excel: variabelen vergelijken

Laten we twee tabellen maken en ze labelen als Werkelijk en Verwacht .

Chi-Square-test in Excel: variabelen vergelijken

Om de verwachte waarden voor zowel airconditioning als voorkeursgebied te krijgen, vermenigvuldigt u  D5  met  B7 en deelt u het vervolgens door  D7 .

Chi-Square-test in Excel: variabelen vergelijken

Het volgende is om de verwachte waarde van de airconditioning of het voorkeursgebied te krijgen, vermenigvuldig  D5  met  C7 en deel het vervolgens door  D7 .

Chi-Square-test in Excel: variabelen vergelijken

Voor de verwachte waarde van de gewenste ruimte of airconditioning vermenigvuldigt u  D6  met  B7 en deelt u het vervolgens door  D7 .

Chi-Square-test in Excel: variabelen vergelijken

Laten we ten slotte de verwachte waarde van zowel airconditioning als de gewenste ruimte berekenen. Vermenigvuldig  D6  met  C7 en deel het dan door  D7 .

Chi-Square-test in Excel: variabelen vergelijken

Markeer het bereik van de verwachte waarden om de som te vinden, die 546 zou moeten zijn.

Chi-Square-test in Excel: variabelen vergelijken

Nu gaan we de relatie tussen de werkelijke en verwachte waarden vinden. Laten we eens kijken of ze de neiging hebben om op een bepaalde manier samen te bewegen.

Typ =CHISQ.TEST om de significantie te vinden  . Markeer het bereik van de werkelijke waarden, voeg een komma toe en markeer vervolgens het bereik van de verwachte waarden om de  p-waarde te krijgen .

Chi-Square-test in Excel: variabelen vergelijken

Op basis van het resultaat is dit een kleine willekeurige kans. Er lijkt een verband te bestaan ​​tussen de variabele voor het voorkeursgebied en de variabele voor airconditioning.

Chi-Square-test in Excel: variabelen vergelijken


Query's samenvoegen met behulp van Anti Join in Excel met Power Query
Count Verschillende waarden in Excel: klassieke tot moderne benaderingen
Proportie- en frequentietabellen in Excel

Conclusie

De Chi-kwadraat- test is een veelgebruikte techniek die ons helpt het verschil per categorie te kennen, en is een goed voorbeeld van A/B-testen.

Een ander ding om te onthouden is dat de waarnemingen onafhankelijk moeten zijn. Op basis van ons voorbeeld kijken we naar twee binaire variabelen, een specifiek type categorische variabele.

Laten we er ten slotte rekening mee houden dat het lastig kan worden als we veel categorieën hebben.

Ik hoop dat dit iets is dat je kunt gebruiken voor A/B-testen, of het nu in Excel of Python is.

Al het beste,


Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Wat is zelf in Python: voorbeelden uit de echte wereld

Een RDS-bestand opslaan en laden in R

Een RDS-bestand opslaan en laden in R

Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.

First N Business Days Revisited – Een DAX-coderingstaaloplossing

First N Business Days Revisited – Een DAX-coderingstaaloplossing

In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Breng inzichten onder de aandacht met behulp van de Multi Threaded Dynamic Visuals-techniek in LuckyTemplates

Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.

Inleiding tot het filteren van context in LuckyTemplates

Inleiding tot het filteren van context in LuckyTemplates

In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Beste tips voor het gebruik van de apps in LuckyTemplates Online Service

Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Analyseer winstmargeveranderingen in de loop van de tijd - analyse met LuckyTemplates en DAX

Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Materialisatie-ideeën voor gegevenscaches in DAX Studio

Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.

Zakelijke rapportage met behulp van LuckyTemplates

Zakelijke rapportage met behulp van LuckyTemplates

Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten

Wat is LuckyTemplates Gateway? Alles wat u moet weten