Dplyr Kullanarak Rde Satırları Düzenleme, Filtreleme ve Gruplandırma

Bu öğretici, dplyr paketi hakkındaki tartışmanın devamıdır . R'de satırları nasıl düzenleyeceğinizi, filtreleyeceğinizi ve gruplandıracağınızı öğreneceksiniz.

Bir önceki ders sütun işlemleri üzerineydi. Bu kez odak, dplyr içindeki satır işlemleri olacaktır .

Bir veri kümesini sıralama ve filtreleme ile kayıtları toplama ve özetleme gibi temel konuları ele alacağız . Bu dersten ne bekleyeceğiniz konusunda size bir genel bakış sağlamak için, MS Excel'de bir pivot tablo düşünün.

İçindekiler

Başlarken

RStudio'da yeni bir R betiği açın.

Sütun işlemleri dersine benzer şekilde, bu gösteri Lahman veri kümesi paketini kullanacaktır . Hızlı bir google araması yaparak indirin.

Lahman paketini R'ye getirmek için library (Lahman) komutunu çalıştırın . dplyr paketini etkinleştirmek için library (tidyverse) komutunu çalıştırın . Ayrıca, R'de kuralları adlandırmak için en iyi uygulamanın küçük harfler kullanmak olduğunu unutmayın , bu nedenle Ekipleri ekiplere atayın .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Satır İşlemleri İçin Temel Fonksiyonlar

1. Satırları R'de Yerleştirin

Dpyll'deki ilk satır işlemi, düzenle ( ) şeklindedir . Bu işlev, satırları yeniden sıralamanıza olanak tanır. Önce df veri çerçevesini ve ardından verilen alanları düzenleyerek çalışır .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Örneğin teamID'ye göre sıralayalım . Düzenlemeyi çalıştırın (ekipler, ekip kimliği) .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Azalan düzende dizilmelerini istiyorsanız desc ( ) işlevini kullanmanız gerekir.

Örnek olarak, yıla göre azalan düzende sıralamak istiyorsanız, edit (teams, desc(yearID)) komutunu çalıştırın .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Bunu yaptığınızda, çıktıyı tekrar ekiplere atamazsınız . Sadece sonucu Konsolda görüyorsunuz.

Birden çok kritere göre sıralamak da mümkündür. Örneğin, takım kimliğine ve ardından yıl kimliğine göre azalan düzende sıralamak istiyorsanız, yalnızca bu kodu çalıştırmanız gerekir:

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Satırları sıralarken verileri değiştirmiyorsunuz. Veriler sadece taşınıyor. Hiçbir şey eklenmez veya çıkarılmaz.

2. R'deki Satırları Filtrele

Filtre ( ) işlevi, seçilen ölçüte göre veri ekler veya kaldırır. Temel kodu:

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Örnek olarak, yearID'nin 2000'den büyük veya eşit olduğu tüm verileri alalım. Filtre işlevinin biçimini izleyin ve gerekli bilgileri girin. Ardından çalıştırın. Bunu yeni bir nesneye atamayı unutmayın. Bu durumda, modern olarak atandı .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Satırların gerçekten filtrelenip filtrelenmediğini kontrol etmek için dim ( ) işlevini kullanabilirsiniz . Veri çerçevesindeki satır ve sütun sayısını verir.

dim (teams) komutunu çalıştırırsanız , veri çerçevesinde 2.955 satır ve 48 sütun olduğunu görürsünüz.

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

dim işlevini modern üzerinde çalıştırırsanız , satır sayısının 630'a düştüğünü, sütun sayısının ise aynı kaldığını görürsünüz.

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Bazı kayıtlar 2000 yılını aştığı için satırlar kısaltılmıştır.

Satırları Birden Çok Alana Göre Filtrele

R'de satırları birden çok alana göre filtrelemek de mümkündür. AND ve OR deyimlerini kullanmanız gerekir .

Örneğin ekipleri alana göre filtreleyelim. Bu durumda, yeni bir ohio nesnesi yaratılır. Filtre kriterleri, teamID'nin yalnızca Cleveland VE Cincinnati'yi içermesi gerektiğidir .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Eşitliği kontrol etmek için çift eşittir işaretini ( == ) kullanmanız gerekir . Yalnızca bir eşittir işareti kullanırsanız, R bunu bir atama operatörü olarak kabul eder. VE'yi temsil etmek için ve işaretini ( & ) kullanın .

Kontrol etmek için dim işlevini kullanın. Satır sayısının 0 olduğunu göreceksiniz.

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Bu, hem Cleveland hem de Cincinnati'de bulunan herhangi bir takım olmadığı anlamına gelir.

Sonra, Cleveland VEYA Cincinnati'yi deneyelim . OR operatörü, boru operatörü ( | ) tarafından temsil edilir . Yani, yapmanız gereken tek şey ve işaretini boru operatörüyle değiştirmek ve ardından onu çalıştırmak. Ardından, dim işlevini tekrar çalıştırın.

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Sıfır yerine 251 satır olduğunu göreceksiniz.

Şimdi, çift eşittir işaretini kullanmayı unutur ve bunun yerine yalnızca bir tane kullanırsanız ne olur? İşte olanlar:

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

RStudio, Konsolda çift eşittir işaretini kullanmanızı hatırlatan çok yardımcı bir hata mesajı gösterecektir.

3. R'deki Satırları Gruplandırın ve Özetleyin

Group by ( ) işlevi, kayıtları seçilen sütunlara göre toplamanıza ve ardından bu toplamaya göre başka bir sütunu özetlemenize olanak tanır.

( ) işlevine göre gruplandırma şu algoritmayı izler:

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Örnek olarak teamID'ye göre gruplandıralım ve yeni bir nesneye atayalım. Bu durumda, yeni nesneye team_ID adı verilir . Ardından yazdırın.

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Konsolda, ilk satırın bunun bir tibble olduğunu söylediğini fark edeceksiniz .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Tibble , temel veri çerçevesi üzerinde düzenli bir iyileştirmedir. Bu, kutudan çıkar çıkmaz mevcut olanı zenginleştiren ve iyileştiren paketteki bir özelliktir.

İkinci satır Gruplar'dır . Böylece, veriler artık teamID sütununa göre gruplandırılmıştır.

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Ve bununla, artık bu gruplarda özetle ( ) işlevini kullanabilirsiniz .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Not: özetleme işlevi s veya z ile olabilir ve İngiliz veya Amerikan İngilizcesinin kullanımına bağlı olacaktır.

Örneğin, team_ID'yi özetleyelim ve bazı temel özet istatistikleri alalım. Her takımın Galibiyetlerinin ortalamasını, minimumunu ve maksimumunu bulalım. Çalıştır'ı seçmeden önce kodun tamamını vurgulamayı unutmayın .

Dplyr Kullanarak R'de Satırları Düzenleme, Filtreleme ve Gruplandırma

Daha sonra Konsolda her takımın istatistiklerinin bir özetinin görüntülendiğini görebilirsiniz. Bu, verileri topladığınız ve özetlediğiniz bir pivot tabloya çok benzer.


R'deki Veri Çerçeveleri: Temelleri Öğrenme
R'deki Faktör Düzeyleri: Kategorik ve Sıralı Değişkenleri Kullanma
R'de Sütunları Ekle, Kaldır ve Yeniden Adlandır dplyr Kullanarak

Çözüm

Özetlemek gerekirse, dplyr'deki iki işlem tartışılmıştır. Sütun işlemlerine odaklanan önceki bir öğretici. Bu arada, bu güncel ders size RStudio'da dplyr paketini kullanarak satır işlemlerini nasıl gerçekleştireceğinizi gösterdi . Özellikle, R'de satırları nasıl düzenleyeceğinizi, filtreleyeceğinizi ve gruplandıracağınızı öğrendiniz.

Öğrenilecek bir sonraki şey, bu iki işlemin nasıl birleştirileceğidir. Şimdiye kadar öğrendiğiniz tüm fonksiyonları kullanmak, R'de kod oluşturmanıza büyük ölçüde yardımcı olacaktır. Ancak, daha yararlı bir teknik bir boru hattı olacaktır. Bu, her şeyin birlikte akmasına yardımcı olacaktır. Bu nedenle, sonraki öğreticileri de gözden geçirdiğinizden emin olun.

Leave a Comment

Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm

Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm

Excel hücrelerini metne sığdırmak için güncel bilgileri ve 4 kolay çözümü keşfedin.

Bir Excel Dosyasının Boyutu Nasıl Küçültülür – 6 Etkili Yöntem

Bir Excel Dosyasının Boyutu Nasıl Küçültülür – 6 Etkili Yöntem

Bir Excel Dosyasının Boyutunu Küçültmek için 6 Etkili Yöntem. Hızlı ve kolay yöntemler ile verilerinizi kaybetmeden yer açın.

Pythonda Self Nedir: Gerçek Dünyadan Örnekler

Pythonda Self Nedir: Gerçek Dünyadan Örnekler

Python'da Self Nedir: Gerçek Dünyadan Örnekler

Rde Bir RDS Dosyası Nasıl Kaydedilir ve Yüklenir

Rde Bir RDS Dosyası Nasıl Kaydedilir ve Yüklenir

R'de bir .rds dosyasındaki nesneleri nasıl kaydedeceğinizi ve yükleyeceğinizi öğreneceksiniz. Bu blog aynı zamanda R'den LuckyTemplates'a nesnelerin nasıl içe aktarılacağını da ele alacaktır.

İlk N İş Günü Tekrar Ziyaret Edildi – Bir DAX Kodlama Dili Çözümü

İlk N İş Günü Tekrar Ziyaret Edildi – Bir DAX Kodlama Dili Çözümü

Bu DAX kodlama dili eğitiminde, GENERATE işlevinin nasıl kullanılacağını ve bir ölçü başlığının dinamik olarak nasıl değiştirileceğini öğrenin.

LuckyTemplatesda Çok İş Parçacıklı Dinamik Görsel Tekniği Kullanarak Öngörüleri Sergileyin

LuckyTemplatesda Çok İş Parçacıklı Dinamik Görsel Tekniği Kullanarak Öngörüleri Sergileyin

Bu eğitici, raporlarınızdaki dinamik veri görselleştirmelerinden içgörüler oluşturmak için Çok Kanallı Dinamik Görseller tekniğinin nasıl kullanılacağını kapsayacaktır.

LuckyTemplatesda İçeriği Filtrelemeye Giriş

LuckyTemplatesda İçeriği Filtrelemeye Giriş

Bu yazıda, filtre bağlamından geçeceğim. Filtre bağlamı, herhangi bir LuckyTemplates kullanıcısının başlangıçta öğrenmesi gereken en önemli konulardan biridir.

LuckyTemplates Çevrimiçi Hizmetindeki Uygulamaları Kullanmak İçin En İyi İpuçları

LuckyTemplates Çevrimiçi Hizmetindeki Uygulamaları Kullanmak İçin En İyi İpuçları

LuckyTemplates Apps çevrimiçi hizmetinin çeşitli kaynaklardan oluşturulan farklı raporların ve içgörülerin yönetilmesine nasıl yardımcı olabileceğini göstermek istiyorum.

Fazla Mesai Kâr Marjı Değişikliklerini Analiz Edin - LuckyTemplates ve DAX ile Analitik

Fazla Mesai Kâr Marjı Değişikliklerini Analiz Edin - LuckyTemplates ve DAX ile Analitik

LuckyTemplates'da ölçü dallandırma ve DAX formüllerini birleştirme gibi teknikleri kullanarak kâr marjı değişikliklerinizi nasıl hesaplayacağınızı öğrenin.

DAX Studioda Veri Önbellekleri İçin Materyalleştirme Fikirleri

DAX Studioda Veri Önbellekleri İçin Materyalleştirme Fikirleri

Bu öğreticide, veri önbelleklerini gerçekleştirme fikirleri ve bunların DAX'ın sonuç sağlama performansını nasıl etkilediği tartışılacaktır.