Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm
Excel hücrelerini metne sığdırmak için güncel bilgileri ve 4 kolay çözümü keşfedin.
Bugünkü blogda, Python bağıntısını görselleştirme sürecini ve bu görselleri LuckyTemplates'a nasıl aktaracağımızı inceleyeceğiz . Bu eğitimin tam videosunu bu blogun alt kısmından izleyebilirsiniz.
İçindekiler
Korelasyonları Anlamak
İşte farklı korelasyon türlerini gösteren güzel bir resim.
Soldan başlayarak, mükemmel pozitif korelasyona sahibiz , yani korelasyon değeri 1'dir. Ardından, azalan sırada 0'a giden pozitif korelasyonlar gelir.
Ortadaki grafik, 0'a eşit bir korelasyon değeri öneren bir korelasyon göstermiyor.
Son olarak, sağ taraf 0'dan azalan negatif korelasyon değerlerini gösterir. En sağdaki grafik -1 korelasyon değerine sahip mükemmel negatif korelasyondur .
Python Korelasyonu için Paketler
Bu eğitim için dört paket kullanacağız. İlk paketimiz, veri işleme için kullanılacak ve pd değişkeni olarak kaydedilecek Pandas .
Görselleştirme için, bu fonksiyonların daha kolay kullanılması için plt değişkeni olarak kaydedilen Matplotlib'i kullanacağız . İstatistiksel görselleştirme kütüphanemiz olan Seaborn sns olarak kaydedilecektir . Ve son olarak, lineer cebir için np olarak kaydedilecek Numpy kullanılacaktır.
Veriler için Seaborn'da örnek bir veri seti kullanacağız. Daha sonra sns değişkenini kullanarak elmas veri setini aşağıda gösterildiği gibi getireceğiz . .
Verilerin Nitelikleri
dataset.info işlevini kullanarak verilerimizin özelliklerini görüntüleyebiliriz . Bu işlev, aşağıdaki son sütunda görüldüğü gibi bize tüm farklı veri türlerini gösterir.
Korelasyonun yalnızca sayısal değişkenler üzerinde çalıştığını unutmayın, bu nedenle çoğu zaman sayısal değişkenlere bakacağız. Bununla birlikte, bazı kategorik değişkenleri görselleştirme için nasıl kullanacağımızı da öğreneceğiz.
Python Korelasyon Veri Kümesi
dataset.head şeklinde yazılan fonksiyon başlığını kullanarak verilerimizin bu şekilde görünmesi gereken ilk beş satırını elde edebiliriz.
İlk sütunda karat var , ardından kesim , renk ve berraklık kategorik değişkenleri ve ardından verilerin geri kalanı için sayısal değerler var.
Python Korelasyonu: Dağılım Grafiği Oluşturma
Korelasyonları görselleştirirken ve iki değişkene bakarken, genellikle dağılım grafiklerine bakarız .
Bu nedenle Seaborn kütüphanesini kullanarak yukarıda data=dataset şeklinde kaydettiğimiz dataların içine geçtiğimiz scatter plot fonksiyonunu kullanarak scatter grafiğimizi oluşturduk . Ardından, sırasıyla karat ve fiyat olmak üzere X ve Y değişkenlerini belirledik .
İşte Seaborn kitaplığıyla yapılan dağılım grafiğimiz.
Bu dağılım grafiğinin oldukça yoğun olduğunu görebilirsiniz. Bunun nedeni, yaklaşık 54.000 veri satırına sahip olmamız ve noktaların mutlaka en iyi şekilde temsil edilmemesidir.
Dağılım grafiğini biçimlendirmenin farklı yollarını görmek için Shift + Tab tuşlarına basabiliriz. Bize dağılım grafiğimize ekleyebileceğimiz farklı parametrelerin bir listesini gösterecek.
Daha aşağı kaydırmak, listelenen parametrelerin her birinin ne yaptığı hakkında bize bilgi verecektir.
Ek Dağılım Grafiği Parametreleri
Biraz dalalım. Linewith = 0 yapabiliriz , çünkü aşağıda gösterilen ilk dağılım grafiğimizdeki beyaz çizgiler bir şekilde belirsiz şeylerdir.
Opaklığı kontrol edebilmek için alfayı da ayarlamak istiyoruz. Örneğimiz için alpha=0.2 kullanalım . Ama tabii ki bunu 0,1 olarak da değiştirebilirsiniz.
Bu parametreleri eklersek ve Çalıştır'a tıklarsak , dağılım grafiğimizin beyaz çizgiler olmadan daha opaklaştığını görebilirsiniz.
Aradığınız en iyi görseli elde etmek için parametrelerle oynayabilirsiniz.
Kategorik Değişkenleri Kullanma
Görsellerimizi geliştirmek için bazı kategorik değişkenlerimizi de kullanabiliriz. Örneğin, verilerimizin pırlantamız için bir kesimi olduğunu biliyoruz .
Yapabileceğimiz şey, hue parametresini hue='cut' olarak kullanarak o kesim kategorisine geçmek . Bu, renkleri değiştirerek bu noktaları görselleştirmemizi sağlayacaktır.
Elbette, örneğin alfa gibi daha fazla parametre ekleyebiliriz. Bunu tekrar ekleyebilir, 0,2'ye ayarlayabilir ve bunun görseli nasıl değiştirdiğini görebiliriz. Çalıştır'a tıklayalım ve biraz fark görebilelim.
Aradığımız görseli elde etmek için parametrelerle oynayabiliriz. Netlik gibi farklı kategorileri de kullanabiliriz, bu bize netlik kategorilerini verir ve aynı zamanda bize bu dağılıma biraz farklı bir bakış açısı verir.
Diğer Değişkenlerle Korelasyon
Fiyat ve karat dışındaki diğer değerlerin nasıl ilişkilendirildiği de ilginizi çekebilir. Dolayısıyla , o elmasın sayısal boyutu olan tablo ve derinlik için dağılım grafiğine bakarsak , bire bir doğrusal ilişki olmadığını görebiliriz.
Derinlik ve fiyat gibi diğer iki değişkene de bakabiliriz . Grafiğe dayanarak, veri merkezlerinin orta alan etrafında olduğunu görebiliriz.
Python Korelasyonu: Bir Regresyon Grafiği Oluşturma
İki değişken arasındaki doğrusal ilişkiyi değerlendirmemizi sağlayan regresyon grafiği dediğimiz şeye geçelim.
Yani bu sefer scatter plot fonksiyonu yerine regplot fonksiyonunu kullanacağız . Aynı yapıya geçeceğiz - verilerimiz, ardından X ve Y değişkenleri.
Sonuç, değişkenler arasındaki doğrusal ilişkiyi ölçen bir çizgiyi gösterir. Değerlerimizin bu gerileme çizgisi etrafında nasıl döndüğü de açıktır.
Bu şu anda çok güzel bir görsel değil, ancak daha iyisini elde etmek için hala optimize edebiliriz. Örneğin, Matplotlib değişkenini kullanarak bir stile geçebiliriz. plt.style.use('dark_background') kodunu kullanarak stili koyu arka plana değiştirebiliriz .
Aynı regresyon grafiğini alın ve dağılım ve çizgimiz için bazı anahtar sözcükleri iletin. Regresyon doğrumuz için kırmızı rengi ve 1 çizgi genişliğini kullanalım. Bu, line_kws={"renk" : "kırmızı", 'çizgi genişliği' : 1) şeklinde yazılır .
Dağılım anahtar kelimelerimiz için rengi beyaz, kenar rengini gri ve opaklığı 0,4 olarak ayarlayarak scatter_kws={“renk” : “beyaz”, 'kenar rengi' : 'grey', 'alfa' : 0.4 olarak yazalım. ).
Bu parametreler bize aşağıda gösterilen biraz farklı bir görünüm verir.
Python Korelasyonu: Bir Korelasyon Matrisi Oluşturma
Şimdiye kadar, sadece iki değişkenli dağılım grafiklerine baktık, ancak tüm değişken korelasyonlarımıza da bakmak isteyebiliriz.
Bu, dataset.corr olarak temsil edilen korelasyon adı verilen bir veri çerçevesi işlevine sahip veri kümemiz kullanılarak gerçekleştirilir . Ve elde edeceğimiz şey, bize bu değişkenlerin her biri üzerindeki korelasyonları gösteren bir matris olacak.
Yukarıdaki tablodaki sayılar , tüm bu değişkenler arasındaki doğrusal ilişkiye odaklanan Pearson korelasyonunu temsil eder.
Ancak değişkenlerimizin tamamen doğrusal olarak ilişkili olup olmadığından emin değilsek, doğrusal kısımdan çok etkiye odaklanan farklı bir korelasyon türü kullanabiliriz. Buna Spearman korelasyonu denir .
Ve tüm bunlarla ilgili bilgileri Shift + Tab tuşlarına basarak görebiliriz. Aşağı kaydırırsanız, Spearman sıra korelasyonunu, Pearson korelasyon katsayısını ve verilerimizi ölçmek için pek çok farklı yolu görebiliriz.
Daha önce korelasyon matrisimize baktığımızda, fiyat ve karat arasında oldukça iyi bir korelasyon olduğunu biliyoruz.
Bunlar, 0.92'de oldukça lineer olduklarını gösteren buradaki grafiğimizden.
Şimdi bunun yerine Spearman korelasyonunu kullanırsak, etki veya sıralama 0,96 ile biraz daha yüksek olacaktır.
Bu farklı korelasyon türleri, bu değişkenler arasındaki farklı korelasyon özelliklerini almamıza izin verir.
Çoklu x Tek Değişkenli Korelasyon
Bazen bir matris görmek istemiyoruz çünkü tüm değişkenlerin tek bir değişkenle (örneğin, fiyat) korelasyonuyla daha çok ilgileniyoruz.
O zaman yapabileceğimiz şey, dataset.corr ve ardından 'price' kullanarak fiyatı izole etmektir .
Şimdi, fiyatın bu tablodaki tüm farklı sayısal değişkenlerimizle ilişkili olduğunu görebiliriz. Ve bunu yapmak isteyebilmemizin nedeni görsel planlar içindir.
Şimdi korelasyon matrisimizi bir ısı haritasıyla görselleştirmeye bakalım.
Python Korelasyonu: Isı Haritası Oluşturma
sns.heatmap işlevini kullanarak bu korelasyon değişkenini bir Seaborn ısı haritasına aktarabiliriz .
Bu bize buna benzeyen bir ısı haritası verecektir.
Yine tercihimize göre parametreler ekleyebiliriz. linewidths=1 parametresini girebilir ve annot=True kullanarak açıklamalar ekleyebiliriz .
Ve ısı haritamızın artık oldukça farklı göründüğünü görebilirsiniz. Şu anda oldukça güzel bir ısı haritamız var.
Satırları ve açıklamaları eklemenin faydasını görebiliriz. Yine, Shift + Tab'a basarsak, içine girebilecek tüm farklı parametreler görünecektir.
Ardından, kodumuza method='spearman ' eklemeyi deneyin , böylece kullanım durumunuza bağlı olarak farklı türde bir bağıntıyı nasıl kullanacağınızı öğreneceksiniz.
Tek Değişkenli Isı Haritası
Ardından, bir değişkeni izole ediyoruz ve korelasyonun negatiften pozitife doğru gittiği bir ısı haritası oluşturuyoruz.
Bu bize aşağıdaki ısı haritasını verecektir.
Stili de kesinlikle değiştirebiliriz. Örneğin cmap parametresini cmap='coolwarm' olarak kullanabiliriz . Bu, renkleri soğuk ve sıcak olarak değiştirir ve siyah arka planımızı da ortadan kaldırır.
Çalıştır'a tıklarsak , aşağıdaki ısı haritasını alırız. Soğuk için maviye sahibiz ve ardından sıcak için kırmızı çubuklara sahibiz.
Haritamızı renk çubuğuyla hizalamak için yönü de değiştirebiliriz. Bu, sort_values parametremizi düzenleyerek ve abuse=False ekleyerek yapılır .
Bu, en ilişkili olandan (kırmızı çubuk) en az ilişkili olana (mavi çubuk) doğru gidecektir.
Python Korelasyonu: Merdiven Görsel Oluşturma
korelasyonumuzu görselleştirmenin gelişmiş bir yolu, daha önce yapmış olduğumuz tüm korelasyonları engellemek için bir maske kullanmaktır.
Bunu, korelasyonlarımız için bir merdiven görseli oluşturmak üzere bazı DOĞRU ve YANLIŞ işlevlerini kullanarak Numpy ile yapabiliriz.
İşte sonuçların nasıl görünmesi gerektiği.
Bunu LuckyTemplates'a nasıl aktarabileceğimizi görelim.
LuckyTemplates'da Merdiven Görsel
Öncelikle LuckyTemplates'ı açın. Farklı bir görsel görebilmemiz için bir avokado veri seti getirdim. Bu veri kümesini Alanlar bölmesinin altında görebilirsiniz. Görselleştirmeler bölmesinin altındaki Python simgesine tıklayarak Python görselini başlatın .
ile gösterilen tüm sayısal değişkenleri ekleyerek veri setini oluşturmamız gerekiyor . . Bu değişkenlerin yanındaki onay kutularına tıklayarak bunları ekleyin.
Artık bir veri setimiz olduğuna göre, Jupyter defterimize geçebilir ve daha önce sahip olduğumuz bu kodu kopyalayabiliriz.
Ardından, kodu LuckyTemplates'daki Python betik düzenleyicisine kopyalayacağız.
Ardından, merdiven görseli olacak görselimizi seçeceğiz. Jupyter'a geri döneceğiz, merdiven görselimiz için kullandığımız kodu kopyalayacağız.
Kodu Python betik düzenleyicisine yapıştırın.
Yapılacak son şey , Python betiğinizde gerekli olan plt.show kullandığımızdan emin olmaktır . Kodun son satırına plt.show ekleyin ve script editörünün sağ üst köşesindeki çalıştır simgesine tıklayın.
Daha büyük bir görsel için kutuyu biraz esnetin, böylece köşede çalışan komut dosyasını görebiliriz. Oldukça güzel görünen ısı haritamız için görselimiz hazır.
Ve LuckyTemplates'da, bu görselin veri kümesine göre nasıl değişebileceğini kesinlikle görebiliriz. Örneğin, Görselleştirmeler bölmesinde Dilimleyici simgesine tıklayabilir ve Alanlar bölmesinde Yazım'a gidebiliriz.
Bize veri setimizde geleneksel ve organik olmak üzere iki tür verecektir . Organik diyelim bir türe tıklarsak , ısı haritasının değiştiğini görebilirsiniz.
Bir sonraki geleneksel tipe tıkladığımızda değişiklikler de geçerli olacaktır .
Bu filtrelerin çalışması için Python betiğimizin veri kümesinde kategorik bir değişkene sahip olmamız gerektiğini unutmayın . Gördüğümüz gibi, oluşturduğumuz veri kümesi , görseli bu şekilde filtrelememizi sağlayan type içeriyordu.
Python'da LuckyTemplates Metin Analizinde Veri Modeli İlişkilerinizi Kurma | LuckyTemplates Veri Raporlarında Python Komut Dosyasına Giriş
Çözüm
Bu blogda, Pearson korelasyonu ve Spearman sıralama korelasyonu gibi farklı yöntemleri kullanarak Python ve LuckyTemplates'daki korelasyonları nasıl görselleştireceğinizi öğrendiniz.
Artık veri kümeniz için en iyi görseli elde etmek için dağılım grafikleri, regresyon grafikleri, korelasyon matrisi, ısı haritaları ve merdiven görselleri oluşturabilirsiniz. Stilleri ve görselleri iyileştirmek için çeşitli parametreler de kullanabilirsiniz.
Herşey gönlünce olsun,
Excel hücrelerini metne sığdırmak için güncel bilgileri ve 4 kolay çözümü keşfedin.
Bir Excel Dosyasının Boyutunu Küçültmek için 6 Etkili Yöntem. Hızlı ve kolay yöntemler ile verilerinizi kaybetmeden yer açın.
Python'da Self Nedir: Gerçek Dünyadan Örnekler
R'de bir .rds dosyasındaki nesneleri nasıl kaydedeceğinizi ve yükleyeceğinizi öğreneceksiniz. Bu blog aynı zamanda R'den LuckyTemplates'a nesnelerin nasıl içe aktarılacağını da ele alacaktır.
Bu DAX kodlama dili eğitiminde, GENERATE işlevinin nasıl kullanılacağını ve bir ölçü başlığının dinamik olarak nasıl değiştirileceğini öğrenin.
Bu eğitici, raporlarınızdaki dinamik veri görselleştirmelerinden içgörüler oluşturmak için Çok Kanallı Dinamik Görseller tekniğinin nasıl kullanılacağını kapsayacaktır.
Bu yazıda, filtre bağlamından geçeceğim. Filtre bağlamı, herhangi bir LuckyTemplates kullanıcısının başlangıçta öğrenmesi gereken en önemli konulardan biridir.
LuckyTemplates Apps çevrimiçi hizmetinin çeşitli kaynaklardan oluşturulan farklı raporların ve içgörülerin yönetilmesine nasıl yardımcı olabileceğini göstermek istiyorum.
LuckyTemplates'da ölçü dallandırma ve DAX formüllerini birleştirme gibi teknikleri kullanarak kâr marjı değişikliklerinizi nasıl hesaplayacağınızı öğrenin.
Bu öğreticide, veri önbelleklerini gerçekleştirme fikirleri ve bunların DAX'ın sonuç sağlama performansını nasıl etkilediği tartışılacaktır.