Pythonda Lineer Regresyon

Veri analizinde, kilit etkileyiciler, bağımlı bir değişken üzerinde önemli bir etkiye sahip olan değişkenlerdir. Başka bir deyişle, çıkarların sonucuna en çok katkıda bulunan faktörlerdir. Python'da, bir veri kümesindeki kilit etkileyicileri belirlemek ve farklı değişkenler arasındaki ilişkinin gücünü ve yönünü ölçmek için doğrusal regresyon kullanılır. Bu eğitimin tam videosunu bu blogun alt kısmında izleyebilirsiniz .

Önemli etkileyicileri belirlemek, bir veri kümesindeki temel ilişkileri anlamak ve gelecekteki sonuçlar hakkında tahminler yapmak için yararlı olabilir.

Python kitaplıkları, regresyon analizi gerçekleştirmek ve bir veri kümesindeki önemli etkileyicileri belirlemek için bir dizi araç ve işlev sağlar.

İçindekiler

Lineer Regresyon Modeli Kullanmak

Bu makalede, bazı LuckyTemplates önemli etkileyicilerini taklit etmek için bir doğrusal regresyon modelini nasıl kullanabileceğinizi göstereceğim . Amacımız, başka bir değişkende neyin değiştiğini açıklayabilmek için tüm değişkenlerimizi kullanmaktır.

LuckyTemplates temel etkileyicileri, doğrusal bir regresyon modelidir. Çoğu zaman, kaputun altında ne olduğunu tam olarak bilmesek de bunu kullanırız. Bu eğitimde, bunu sigorta masraflarına katkıda bulunan faktörleri belirlemek için kullanıyorum.

Python'da Lineer Regresyon

Sigorta ücretlerinin veri setine bir göz atalım. Bunun sigara içme durumu, cinsiyet, bölge, çocuklar, VKİ ve yaş ile açıklanmasını istiyorum.

Python'da Lineer Regresyon

Şu anda, kilit etkileyiciler en etkili değişkeni gösteriyor. Sigara içen kişi evet olduğunda, sigara içen kişinin diğer tüm değerlerine kıyasla ortalama ücret 23.615 $ daha yüksektir.

Harika bir görsel ama bize ücretleri etkileyebilecek başka değişkenler vermiyor.

Python'da Lineer Regresyon

Açılır listeyi Artır'dan Azalt'a değiştirerek derinlemesine inceleyelim .

Bu sefer tam tersi. Sigara içmiyorsanız, sigara içenlerin diğer tüm değerlerine kıyasla ortalama ücret 23.615 ABD Doları daha düşüktür.

Python'da Lineer Regresyon

Gördüğünüz gibi bu, bazı Python kodlarını kullanarak oluşturduğum ve minimum koşullu biçimlendirmeyle LuckyTemplates'a aktardığım bir doğrusal regresyon modeli .

Kodlama açısından, üzerinde tam kontrole sahibiz ve bunu ana etkileyici görseline bir alternatif veya tamamlayıcı olarak nasıl oluşturduğumu göreceksiniz.

Python'da Lineer Regresyon

Jüpiter Defterine geçelim. Daha iyi anlaşılması için bunları madde madde açıklayayım.

Python'da Lineer Regresyon

Kullanılan Python Kitaplıkları

İlk kısım, kullanmak istediğim tüm kütüphaneleri yüklediğim yer. Kitaplıklara aşina değilseniz, geliştiricilerin bizim için oluşturduğu kod ve işlev koleksiyonlarıdır.

Pandaları bir veri işleme kitaplığı olan pd olarak ve numpy'yi np olarak doğrusal hesaplamalar ve koşullu işlemler yapmamıza izin vermek için içe aktardım .

Kullanılan Modeller

Gelelim kullandığım modellere. olan sklearn.linear_model'i getirdim ve doğrusal bir regresyon modeli kullandım. İhtiyacımız olursa diye, verilerimizi ölçeklendirmemizi sağlayacak sklearn.preprocessing import StandardScaler'ı da getirdim .

Kullandığım başka bir modelin adı xgboost import XGBRegressor . Bu, karar ağacı ve diğer yararlı yönleri olan bir regresyon modelidir.

Ek olarak, verileri bir eğitim seti ile bir öğrenme seti arasında bölebilmek istediğim için train_set_split'i de kullandım . Makine Öğreniminde, algoritmanın herhangi bir tahminde bulunmadan önce öğrenmesi için bir dizi eğitim verisine ihtiyacımız var.

Ayrıca modeli belirlemek için mean_squared_error dosyasını ve biraz görsel yapmak istersek diye matplotlib.pyplot kütüphanesini getirdim .

Bunların hepsini kullanmayabiliriz ama yardımcı olabilir, o yüzden hepsini koydum.

Python'da Lineer Regresyon

Kullanılan Veri Kümesi

Ardından, veri kümesine hızlıca bir göz atalım. Sigorta veri kümesini getirmek için df = pd.read_csv işlevini kullandım ve ardından df1 = pd.get_dummies (df, drop_first = True) kullanarak verileri kukla değişkenlere dönüştürdüm .

Python'da Lineer Regresyon

Bunun için klavyemizde Esc + B tuşlarına basarak yeni bir hücre oluşturalım ve ardından df.head yazarak verileri değerlendirelim.

Bağımlı değişkenimiz olarak tahmin etmek istediğimiz yaş, cinsiyet, BMI, çocuklar, sigara içenler, bölge ve ücretlere sahibiz. Bunlar, makine öğrenimi için hazırlıksız olarak gelen verilerdir.

Makine öğreniminde kadın, erkek, güneybatı ve kuzeybatı gibi kategorik değişkenleri kullanamayacağız. Bu nedenle, tipik bir regresyon modeli ise, yapmamız gereken ilk şey, kategorik değişkenleri sayısal girdiye dönüştürmektir. 

Python'da Lineer Regresyon

Bunu yapmak için pd.get_dummies işlevini kullandım ve ardından df.head öğesini df1.head olarak değiştirerek bunu sayısal bir sütuna dönüştürdüm . Nasıl göründüğünü göstermek için Çalıştır düğmesine tıklayalım .

Python'da Lineer Regresyon

Artık sex_male , smoker_yes , zone_northwest vb. gibi bu yeni sütun koleksiyonunu görebiliriz . Algoritma, 1 ise evet, 0 ise hayır anlamına geldiğini otomatik olarak bilir.

Modeli aşırı karmaşık hale getirmek istemediğimiz için , dikkat çekici bir şekilde, sex_female ve zone_northeast yoktur . drop_first = True işlevini kullanarak bunları düşürdük .

Yaptığım bir sonraki şey, LinearRegression işlevini getirmek ve onu değişken modele kaydetmek oldu. 

Ayrıca Y değişkenlerimizi tahmin etmek için X ve Y değişkenleri oluşturdum ve daha sonra daha önce kullandığımız aynı veri setini kullanarak tahmin edicilerimiz için diğer tüm sütunları getirdim.

Python'da Lineer Regresyon

X değişkeni için, ücretleri düşürmek için df1.drop ('yükler', eksen=1) kullandık . Öte yandan, Y değişkeni için ücretlere ihtiyacımız var, bu yüzden df1['ücretler'] koyduk .

Aşağıdaki fonksiyonlar ile train_test_split fonksiyonunu kullanarak hem X hem de Y için eğitim ve test setleri oluşturdum ve bunları X ve Y değişkenlerine aktardım.

Ayrıca eğitim verilerini modelimize uydurmak için model.fit kullandım. Bu, doğrusal regresyon modelinin eğitim verilerini öğreneceği anlamına gelir. 

Python'da Lineer Regresyon

Bu kez tahmin edicilerimize bir göz atalım. Bunu görme şeklimiz, katsayılar aracılığıyladır çünkü bunlar, bu özelliklerin veya değişkenlerin her birinin yükleri nasıl etkilediğini açıklar.

Ayrıca , önemli etkileyiciler için sahip olduğumuz sayıyla ve modelimizle karşılaştırırsanız,  sigara içen_yes için katsayı sayısının çok yakın olduğu da dikkat çekicidir .

Özelliklerin ve katsayıların olduğu bir tablo oluşturmak için katsayıları tabloya getirmek ve görseli oluşturmak için pd.DataFrame kullandım.

Python'da Lineer Regresyon

Python'da Lineer Regresyon

Kilit Etkileyenler Görsel İçin Farklı Modeller Kullanmak

Ayrıca, XGB.Regressor'u getirerek kilit etkileyicileri elde etmek için farklı modeller kullanmanız önerilir . 

Modeli temsil ettiğimizde, bu sadece basit bir doğrusal regresyondur; ancak XGB.Regressor'u getirdiğimizde, modeli optimize etmek için kullanabileceğimiz birçok parametre var.

Python'da Lineer Regresyon

Aşağıdaki veri çerçevesini oluşturduğumda da bu işlevleri çoğalttım. Bu katsayılar, lineer regresyonda gördüğümüze kıyasla çok farklı.

Python'da Lineer Regresyon

Bu tablo ile sayılar kesindir. Örneğin, sigara içiyorsanız, masraflarınız 23.787 ABD doları artacaktır. Bir çocuğunuz varsa, 472 dolar artacak ve bu böyle devam edecek.

Python'da Lineer Regresyon

Bu etkileyiciler de önemlidir çünkü doğrusal regresyon tablosunda sahip olduklarımızı yansıtırlar. Biraz farklı ama çok yakın çünkü bu etkileyicilerin toplamı bir. Bu, etkileyicilere bakmanın farklı bir yoludur.

Python'da Lineer Regresyon

Lineer Regresyon Analizinin Doğruluğunun Test Edilmesi

Bundan sonra modelimizin doğruluğunu görmek istiyoruz, bu yüzden y_pred = model.predict (X_test) kullandık . 5885.7 ile kapalı olduğuna dair bir tahminle geldi. 

Bu sadece bir test veri seti ve tahmin iyi ya da kötü olsun, yine de değerlendirmemiz gerekiyor. Bunu şu anda yapmayacağız, çünkü yalnızca kilit etkileyicilerimize odaklanıyoruz. 

Python'da Lineer Regresyon

LuckyTemplates'a geri dönersek, size bunu nasıl çok kolay bir şekilde ifade ettiğimi göstereceğim. Bu, özellikleri ve etkileyicileri görebileceğiniz ayrı bir tablodur. 

Python'da Lineer Regresyon

Bunu Verileri Dönüştür seçeneğine giderek yaptım .

Python'da Lineer Regresyon

Sonra veri setimi çoğalttım ve bu tabloyu oluşturabildim. Python kodunu görmek ve kullandığımız değişkenleri incelemek için Uygulanan Adımlara da gidebiliriz .

Python'da Lineer Regresyon

Python betiğini çift tıklayarak  açalım .

Python'da Lineer Regresyon

Kütüphanelerimizi getirdik. Bunu, yalnızca sıfırlar ve birlerden oluşan bir makine öğrenimi, ön işleme veri kümesine dönüştürdük. 

Ayrıca, bir regresyon modeli getirdik, X ve Y'mizi verilere uyacak şekilde oluşturduk ve ardından tabloyu çıktı olarak kaydettik. Model yeterince iyi, bu yüzden bir eğitim testi seti kullanmadım.

Yaptığım başka bir şey de veri setini df olarak değiştirmek çünkü yazması daha kolay. Veri kümesi, orijinal verilerin değişkenidir.

Bu tablo ile çıktı olarak kaydettim, bu yüzden bu katsayılara sahibiz.

Python'da Lineer Regresyon

Bunu görsel olarak getirmek için Kapat ve Uygula'yı tıklayın .

Python'da Lineer Regresyon

Artık bir çubuk grafiğimiz var . Artıları ve eksileri göstermek için koşullu biçimlendirmeyi de kullandım.

Python'da Lineer Regresyon


DAX Studio ve Tablo Düzenleyiciyi LuckyTemplates'a Yükleme
LuckyTemplates'da Sorgu Ayarlarını Yapılandırma DAX Studio
Sorgu Düzenleyicisi Yoluyla LuckyTemplates Parametreleri

Çözüm

Sonuç olarak, önemli etkileyicileri anlamak ve Python'da doğrusal regresyon uygulamak, veri analizi ve tahmin için güçlü bir araç olabilir.

Bağımlı bir değişkeni etkileyen temel faktörleri belirleyerek ve bunların ilişkilerini modellemek için doğrusal regresyon kullanarak, gelecekteki sonuçları daha iyi anlayabilir ve tahmin edebiliriz .

Python'un güçlü kitaplıklarının kullanımıyla, doğrusal regresyon uygulamak ve verilerden anlamlı içgörüler çıkarmak kolaydır.

Herşey gönlünce olsun,

Leave a Comment

Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm

Excel Hücrelerini Metne Sığdırma: 4 Kolay Çözüm

Excel hücrelerini metne sığdırmak için güncel bilgileri ve 4 kolay çözümü keşfedin.

Bir Excel Dosyasının Boyutu Nasıl Küçültülür – 6 Etkili Yöntem

Bir Excel Dosyasının Boyutu Nasıl Küçültülür – 6 Etkili Yöntem

Bir Excel Dosyasının Boyutunu Küçültmek için 6 Etkili Yöntem. Hızlı ve kolay yöntemler ile verilerinizi kaybetmeden yer açın.

Pythonda Self Nedir: Gerçek Dünyadan Örnekler

Pythonda Self Nedir: Gerçek Dünyadan Örnekler

Python'da Self Nedir: Gerçek Dünyadan Örnekler

Rde Bir RDS Dosyası Nasıl Kaydedilir ve Yüklenir

Rde Bir RDS Dosyası Nasıl Kaydedilir ve Yüklenir

R'de bir .rds dosyasındaki nesneleri nasıl kaydedeceğinizi ve yükleyeceğinizi öğreneceksiniz. Bu blog aynı zamanda R'den LuckyTemplates'a nesnelerin nasıl içe aktarılacağını da ele alacaktır.

İlk N İş Günü Tekrar Ziyaret Edildi – Bir DAX Kodlama Dili Çözümü

İlk N İş Günü Tekrar Ziyaret Edildi – Bir DAX Kodlama Dili Çözümü

Bu DAX kodlama dili eğitiminde, GENERATE işlevinin nasıl kullanılacağını ve bir ölçü başlığının dinamik olarak nasıl değiştirileceğini öğrenin.

LuckyTemplatesda Çok İş Parçacıklı Dinamik Görsel Tekniği Kullanarak Öngörüleri Sergileyin

LuckyTemplatesda Çok İş Parçacıklı Dinamik Görsel Tekniği Kullanarak Öngörüleri Sergileyin

Bu eğitici, raporlarınızdaki dinamik veri görselleştirmelerinden içgörüler oluşturmak için Çok Kanallı Dinamik Görseller tekniğinin nasıl kullanılacağını kapsayacaktır.

LuckyTemplatesda İçeriği Filtrelemeye Giriş

LuckyTemplatesda İçeriği Filtrelemeye Giriş

Bu yazıda, filtre bağlamından geçeceğim. Filtre bağlamı, herhangi bir LuckyTemplates kullanıcısının başlangıçta öğrenmesi gereken en önemli konulardan biridir.

LuckyTemplates Çevrimiçi Hizmetindeki Uygulamaları Kullanmak İçin En İyi İpuçları

LuckyTemplates Çevrimiçi Hizmetindeki Uygulamaları Kullanmak İçin En İyi İpuçları

LuckyTemplates Apps çevrimiçi hizmetinin çeşitli kaynaklardan oluşturulan farklı raporların ve içgörülerin yönetilmesine nasıl yardımcı olabileceğini göstermek istiyorum.

Fazla Mesai Kâr Marjı Değişikliklerini Analiz Edin - LuckyTemplates ve DAX ile Analitik

Fazla Mesai Kâr Marjı Değişikliklerini Analiz Edin - LuckyTemplates ve DAX ile Analitik

LuckyTemplates'da ölçü dallandırma ve DAX formüllerini birleştirme gibi teknikleri kullanarak kâr marjı değişikliklerinizi nasıl hesaplayacağınızı öğrenin.

DAX Studioda Veri Önbellekleri İçin Materyalleştirme Fikirleri

DAX Studioda Veri Önbellekleri İçin Materyalleştirme Fikirleri

Bu öğreticide, veri önbelleklerini gerçekleştirme fikirleri ve bunların DAX'ın sonuç sağlama performansını nasıl etkilediği tartışılacaktır.