Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Questo tutorial esaminerà i fattori e i livelli dei fattori in R. Imparerai come creare un fattore e come regolare i livelli dei fattori.

I fattori vengono utilizzati per memorizzare e lavorare con le variabili in R.

In questo tutorial, avrai a che fare con variabili categoriche e ordinali. Le variabili categoriali sono variabili che coinvolgono una o più categorie che non sono ordinate in alcun modo specifico. Un esempio potrebbero essere i colori. Le variabili ordinali , d'altra parte, sono simili alle variabili categoriali con la differenza che le variabili ordinali hanno un chiaro ordinamento delle categorie. Questo potrebbe essere basso, medio e alto.

Questa è un'introduzione a più termini statistici. Ora stai lentamente esplorando le capacità di R per i dati e l'analisi statistica.

Sommario

Livelli dei fattori categorici in R

Se ricordi in un'altra lezione sui frame di dati , hai utilizzato il simbolo del dollaro ( $ ) per stampare la colonna Species dal set di dati dell'iride . Fallo di nuovo in RStudio . Nella parte più in basso, c'è una riga contenente Livelli composti da setosa , versicolor e virginica .

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Questo è il modo in cui R gestisce le categorie nei dati.

Se utilizzi la funzione univoco ( ) , R elencherà i valori univoci nella colonna specificata. Ad esempio, se esegui unique (iris$Species) , la console visualizza i tre livelli di specie di iris.

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Non esiste un ordinamento intrinseco per questi livelli. Non si può dire che la setosa sia maggiore delle altre due categorie di colore. R, per impostazione predefinita, li dispone in ordine alfabetico.

Livelli dei fattori ordinali in R

Ora proviamo ad esplorare i fattori con l'ordinamento intrinseco della categoria.

Crea un vettore e chiamalo orders . Per questo esempio, assegna a quel vettore i dati utilizzando i nomi delle dimensioni della tazza di Starbucks: alto, venti e grande. Quindi, stampalo.

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Questi dovrebbero essere disposti dal più piccolo al più grande; dovrebbe essere alto, venti e grande. Ma quando esegui la funzione unique ( ) for orders , non sono disposti in quell'ordine.

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Ecco come trasformarli in variabili ordinali. Innanzitutto, devi creare un nuovo vettore. In questo caso, il vettore si chiama new_orders_factor . Assegna a questo vettore la funzione fattore ( ) . All'interno di questa funzione, inserisci il vettore con cui vuoi impostare i livelli. Quindi, indica i livelli nell'ordine in cui vuoi che appaiano.

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Evidenziare l'intera riga di codice e quindi eseguirla. Viene quindi aggiunto un nuovo valore in Ambiente.

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Per verificare se un vettore è stato correttamente assegnato come fattore, utilizzare la funzione is.factor ( ) . Se controlli i due vettori, orders e new_orders_factor , puoi vedere che il primo restituisce FALSE mentre il nuovo vettore è effettivamente un fattore.

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali

Un fattore è un modo speciale per memorizzare una serie di testi. E sebbene sia un vettore di caratteri, può essere memorizzato in un modo che gli consenta di avere un dato numero di categorie che hanno un ordinamento specifico di valori o livelli.

Se controlli utilizzando la funzione livelli ( ) , puoi vedere che i livelli sono ora nell'ordine corretto.

Livelli dei fattori in R: utilizzo di variabili categoriche e ordinali


Creare vettori in R: un'esercitazione dettagliata
Frame di dati in R: apprendere le basi

Conclusione

Sebbene questa lezione possa sembrare esoterica, vedrai come questo fa la differenza quando si ha a che fare con la codifica R più avanzata. È importante conoscere fattori e livelli poiché spesso emergono in molte codifiche R e analisi statistiche.


Power Automate si applica a ogni azione nei flussi di lavoro

Power Automate si applica a ogni azione nei flussi di lavoro

Scopri l

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare le misure DAX

Tecniche di modellazione dei dati per organizzare meglio le misure DAX per un flusso di lavoro più efficiente.

Filtro Power Apps: cosè e come si usa?

Filtro Power Apps: cosè e come si usa?

Scopri come utilizzare la funzione di filtro in Power Apps e come incorporarla nelle formule esistenti all

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Come commentare più righe in Python: una guida semplice e veloce

Connettori Power Automate: numero, testo e data e ora

Connettori Power Automate: numero, testo e data e ora

Acquisisci familiarità con i connettori Power Automate per la manipolazione di numeri, testo e date/ore.

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Budget Vs Actual Vs Last Year - Suggerimenti per la rendicontazione finanziaria

Ora, è molto facile studiare il budget rispetto all

Come salvare e caricare un file RDS in R

Come salvare e caricare un file RDS in R

Imparerai come salvare e caricare oggetti da un file .rds in R. Questo articolo tratta anche come importare oggetti da R a LuckyTemplates.

Che cosè Power Query e M Language: una panoramica dettagliata

Che cosè Power Query e M Language: una panoramica dettagliata

Scopri tutto su Power Query e il linguaggio M per la trasformazione e la preparazione dei dati nel desktop di LuckyTemplates.

Cosè il sé in Python: esempi del mondo reale

Cosè il sé in Python: esempi del mondo reale

Cos'è il sé in Python: esempi del mondo reale

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

Rivisitazione dei primi N giorni lavorativi: una soluzione per il linguaggio di codifica DAX

In questa esercitazione sul linguaggio di codifica DAX, scopri come usare la funzione GENERATE e come modificare dinamicamente il titolo di una misura.