Cosè il sé in Python: esempi del mondo reale
Cos'è il sé in Python: esempi del mondo reale
In questo post, ti mostreremo come utilizzare il test Chi-quadrato in Excel per confrontare le variabili. Puoi guardare il video completo di questo tutorial in fondo a questo blog .
Il test di indipendenza Chi-quadrato ha due variabili categoriche. Scopriremo se c'è qualche relazione tra queste variabili.
Useremo il framework di verifica delle ipotesi. Se non hai familiarità con questo, dai un'occhiata al libro Advancing Into Analytics . Questa è una tecnica di analisi avanzata che utilizza Excel , R e Python.
Per la nostra demo, utilizzeremo un set di dati sulle abitazioni in Excel. Dobbiamo ottenere i valori effettivi utilizzando la tabella pivot e quindi confrontarli con i valori previsti utilizzando le formule.
Verificheremo anche il livello di significatività del 95% e se esiste una relazione tra l'aria condizionata e l'area preferita.
Sommario
Utilizzo del test chi-quadrato in Excel per confrontare le variabili
Facciamo un salto in Excel. Questi sono i prezzi delle case che provengono dal Journal of Applied Econometrics.
Inserisci una tabella pivot , quindi fai clic su OK per utilizzare una colonna indice per contare le osservazioni.
Dai campi della tabella pivot, trascina ' id ' nella sezione Valori. Seleziona Conteggio dalle Impostazioni campo valore poiché questi sono tutti valori univoci.
Il prossimo è trascinare ' prefarea ' in Colonne e quindi trascinare ' airco ' nelle sezioni Righe per vedere i valori effettivi.
Abbiamo un totale di 546 osservazioni. Le 298 non sono né aria condizionata né zona preferenziale, mentre le 53 sono entrambe e così via.
Creiamo due tabelle ed etichettiamole come Actual e Expected .
Per ottenere i valori previsti né per l'aria condizionata né per l'area preferita, moltiplicare D5 per B7 , quindi dividerlo per D7 .
Il prossimo è ottenere il valore atteso dell'aria condizionata o dell'area preferita, moltiplicare D5 per C7 , quindi dividerlo per D7 .
Ora per il valore atteso dell'area preferita o dell'aria condizionata, moltiplica D6 per B7 , quindi dividilo per D7 .
Infine, calcoliamo il valore atteso sia dell'aria condizionata che dell'area preferita. Moltiplica D6 per C7 , poi dividi per D7 .
Evidenzia l'intervallo dei valori attesi per scoprire la somma, che dovrebbe essere 546.
Ora troveremo la relazione tra i valori effettivi e quelli attesi. Controlliamo se tendono a muoversi insieme in un certo senso.
Per trovare il significato, digitare =CHI.Q.TEST . Evidenziare l'intervallo dei valori effettivi, aggiungere una virgola, quindi evidenziare l'intervallo dei valori previsti per ottenere il p-value .
Sulla base del risultato, questa è una piccola possibilità casuale. Sembra esserci qualche relazione tra la variabile dell'area preferita e la variabile dell'aria condizionata.
Unisci le query utilizzando Anti Join in Excel con Power Query
Conteggio valori distinti in Excel: approcci classici a moderni
Proporzioni e tabelle di frequenza in Excel
Conclusione
Il test Chi-quadrato è una tecnica comune che ci aiuta a conoscere la differenza per categoria ed è un buon esempio di test A/B.
Un'altra cosa da ricordare è che le osservazioni devono essere indipendenti. Sulla base del nostro esempio, stiamo osservando due variabili binarie, un tipo specifico di variabile categoriale.
Infine, tieni presente che può diventare complicato quando abbiamo molte categorie.
Spero che questo sia qualcosa che puoi usare per i test A/B, sia in Excel che in Python.
Ti auguro il meglio,
Cos'è il sé in Python: esempi del mondo reale
Imparerai come salvare e caricare oggetti da un file .rds in R. Questo blog tratterà anche come importare oggetti da R a LuckyTemplates.
In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.
Questo tutorial illustrerà come utilizzare la tecnica di visualizzazione dinamica multi-thread per creare approfondimenti dalle visualizzazioni di dati dinamici nei report.
In questo articolo, esaminerò il contesto del filtro. Il contesto del filtro è uno degli argomenti principali che qualsiasi utente di LuckyTemplates dovrebbe inizialmente conoscere.
Voglio mostrare come il servizio online di LuckyTemplates Apps può aiutare nella gestione di diversi report e approfondimenti generati da varie fonti.
Scopri come elaborare le modifiche al margine di profitto utilizzando tecniche come la ramificazione delle misure e la combinazione di formule DAX in LuckyTemplates.
Questo tutorial discuterà delle idee di materializzazione delle cache di dati e di come influiscono sulle prestazioni dei DAX nel fornire risultati.
Se finora utilizzi ancora Excel, questo è il momento migliore per iniziare a utilizzare LuckyTemplates per le tue esigenze di reportistica aziendale.
Che cos'è il gateway LuckyTemplates? Tutto quello che devi sapere