Wat is zelf in Python: voorbeelden uit de echte wereld
Wat is zelf in Python: voorbeelden uit de echte wereld
In dit bericht laten we je zien hoe je de Chi-kwadraat-test in Excel kunt gebruiken om variabelen te vergelijken. Je kunt de volledige video van deze tutorial onderaan deze blog bekijken .
De Chi-kwadraattoets van onafhankelijkheid heeft twee categorische variabelen. We zullen uitzoeken of er een verband is tussen die variabelen.
We zullen het hypothesetoetsingskader gebruiken. Als u hier niet bekend mee bent, bekijk dan het boek Advancing Into Analytics . Dit is een geavanceerde analysetechniek die gebruikmaakt van Excel , R en Python.
Voor onze demo gaan we gebruik maken van een woningdataset in Excel. We moeten de werkelijke waarden verkrijgen met behulp van de draaitabel en deze vervolgens vergelijken met de verwachte waarden met behulp van formules.
We kijken ook naar het significantieniveau van 95% en of er een relatie is tussen de airconditioning en de voorkeursruimte.
Inhoudsopgave
Chi-kwadraattest gebruiken in Excel om variabelen te vergelijken
Laten we naar Excel springen. Dit zijn de huizenprijzen die uit het Journal of Applied Econometrics kwamen.
Voeg een draaitabel in en klik op OK om een indexkolom te gebruiken om waarnemingen te tellen.
Sleep vanuit de draaitabelvelden ' id ' naar het gedeelte Waarden. Selecteer Aantal in de waardeveldinstellingen, aangezien dit allemaal unieke waarden zijn.
Vervolgens sleept u ' prefarea ' naar Kolommen en vervolgens sleept u ' airco ' naar Rijen om de werkelijke waarden te zien.
We hebben in totaal 546 waarnemingen. De 298 zijn geen airconditioning en ook geen voorkeursruimte, terwijl de 53 beide zijn, enzovoort.
Laten we twee tabellen maken en ze labelen als Werkelijk en Verwacht .
Om de verwachte waarden voor zowel airconditioning als voorkeursgebied te krijgen, vermenigvuldigt u D5 met B7 en deelt u het vervolgens door D7 .
Het volgende is om de verwachte waarde van de airconditioning of het voorkeursgebied te krijgen, vermenigvuldig D5 met C7 en deel het vervolgens door D7 .
Voor de verwachte waarde van de gewenste ruimte of airconditioning vermenigvuldigt u D6 met B7 en deelt u het vervolgens door D7 .
Laten we ten slotte de verwachte waarde van zowel airconditioning als de gewenste ruimte berekenen. Vermenigvuldig D6 met C7 en deel het dan door D7 .
Markeer het bereik van de verwachte waarden om de som te vinden, die 546 zou moeten zijn.
Nu gaan we de relatie tussen de werkelijke en verwachte waarden vinden. Laten we eens kijken of ze de neiging hebben om op een bepaalde manier samen te bewegen.
Typ =CHISQ.TEST om de significantie te vinden . Markeer het bereik van de werkelijke waarden, voeg een komma toe en markeer vervolgens het bereik van de verwachte waarden om de p-waarde te krijgen .
Op basis van het resultaat is dit een kleine willekeurige kans. Er lijkt een verband te bestaan tussen de variabele voor het voorkeursgebied en de variabele voor airconditioning.
Query's samenvoegen met behulp van Anti Join in Excel met Power Query
Count Verschillende waarden in Excel: klassieke tot moderne benaderingen
Proportie- en frequentietabellen in Excel
Conclusie
De Chi-kwadraat- test is een veelgebruikte techniek die ons helpt het verschil per categorie te kennen, en is een goed voorbeeld van A/B-testen.
Een ander ding om te onthouden is dat de waarnemingen onafhankelijk moeten zijn. Op basis van ons voorbeeld kijken we naar twee binaire variabelen, een specifiek type categorische variabele.
Laten we er ten slotte rekening mee houden dat het lastig kan worden als we veel categorieën hebben.
Ik hoop dat dit iets is dat je kunt gebruiken voor A/B-testen, of het nu in Excel of Python is.
Al het beste,
Wat is zelf in Python: voorbeelden uit de echte wereld
Je leert hoe je objecten uit een .rds-bestand in R opslaat en laadt. In deze blog wordt ook besproken hoe je objecten uit R naar LuckyTemplates importeert.
In deze tutorial over DAX-coderingstaal leert u hoe u de functie GENERATE gebruikt en hoe u de titel van een maat dynamisch wijzigt.
Deze zelfstudie behandelt hoe u de Multi Threaded Dynamic Visuals-techniek kunt gebruiken om inzichten te creëren op basis van dynamische gegevensvisualisaties in uw rapporten.
In dit artikel zal ik de filtercontext doornemen. Filtercontext is een van de belangrijkste onderwerpen waarover elke LuckyTemplates-gebruiker in eerste instantie zou moeten leren.
Ik wil laten zien hoe de online service LuckyTemplates Apps kan helpen bij het beheren van verschillende rapporten en inzichten die uit verschillende bronnen zijn gegenereerd.
Leer hoe u wijzigingen in uw winstmarge kunt berekenen met behulp van technieken zoals vertakking van metingen en het combineren van DAX-formules in LuckyTemplates.
Deze tutorial bespreekt de ideeën van materialisatie van datacaches en hoe deze de prestaties van DAX beïnvloeden bij het leveren van resultaten.
Als u tot nu toe nog steeds Excel gebruikt, is dit het beste moment om LuckyTemplates te gaan gebruiken voor uw zakelijke rapportagebehoeften.
Wat is LuckyTemplates Gateway? Alles wat u moet weten