Python における Self とは: 実際の例
Python における Self とは: 実際の例
このブログでは、経験的累積分布関数または ECDF プロットとも呼ばれる累積分布プロットの使用方法を示し、他のプロット タイプと比べてこのプロットのバリエーションを使用する利点を紹介します。このチュートリアルのビデオ全体は、このブログの下部でご覧いただけます。
よりも ECDF プロットを好みます。この機能により、ユーザーはプロットを簡単に操作できます。今日は、Python と LuckyTemplates で ECDF を使用する方法を学び、データ配布に関するプレゼンテーションとレポートを改善します。
目次
分布図の種類
まず、土曜日という特定の日のデータをフィルター処理します。分布を説明するために使用されるすべての Python プロットが以下に表示されます。ここには ECDF プロット、ヒストグラム、KDE プロット、ボックス プロットがあります。
これらすべてのプロットは、データがどのように分散または分散されるかを説明します。たとえば、下に進んでヒストグラムを見ると、これらの高いビンのほとんどがデータが配置されている場所であることがわかります。
約 3.50 ドルで、以下のデータセットのヒントデータの最も高いビンがあります。
分布を調べるときに別のメトリックを提供する KDE プロットを使用することもできます。ヒストグラムはこれらのビンに入るカウントを扱いますが、KDE は密度を扱います。
KDE プロットを使用すると、プロット内の最大の密度または最も高い膨らみを見つけることで、ほとんどのデータがどこにあるかを知ることができます。したがって、上の画像では、2 ドルから 4 ドルの間のどこかに分布していると言えます。
同じことが箱ひげ図にも当てはまり、分布が $2 ~ $4 であり、ほとんどのデータがここにあることがわかります。ボックスを分割する水平線である中央値を使用して、最大の分布がどこにあるかを知ることができます。
次に、ECDF プロットが表示されます。Y 軸の左側には、パーセンタイルを表すProportionという単語が表示されます。プロットに基づくと、3.50 ドルではデータの約 50% が確認され、5 ドル以下ではデータの 80% が分散されています。
ヒストグラム プロット コード
ここで、ヒストグラムから始めて、これらの各プロットのコードを示します。これらはすべて非常に類似した反復可能なコーディングを備えているため、テンプレートのように 1 つのコードを使用してそれらをすぐに取り出すことができます。
まず Seabornをインポートしてsb として保存し 、次に matplotlib.pyplot を pltとして 保存する必要があります。 ggplotという背景スタイル とその matplotlib 変数を使用して、さまざまなスタイルを渡します。
たとえば、下の画像では、11 行目にヒストグラムのタイトルと目盛りサイズを追加していることがわかります。yticks と xticks は、それ に応じて x と y のサイズを表します。
14 行目では、Seaborn 変数を使用して、ヒストグラム プロットを表す上記の例のhistplot などの特定のプロットを取り込む 関数を渡します。次に、4 行目のデータをデータセットとして関数に渡します。
値に取り込んだものはすべてデータセットを表し、重複は削除されます。次に、 ヒントにx を使用し、 色相を 使用 します 。seaborn と併用すると、データをカテゴリ別に分けることができます。ビジュアルに戻ると、「the」、「time」、「smoker」などのカテゴリがあることがわかります。
KDE プロット
KDE プロットの場合、すべてがほぼ同じです。シェーディングされた外観を得るには、shade という新しいパラメータを渡すだけです。それ以外は色合い、データ等は同じです。
箱ひげ図では、いくつかの小さな違いを除いて、他のプロットとほぼ同様です。 ここでは 、 x が日、 y がヒントである箱ひげ図関数を使用します 。 このプロットでは色相も使用していません 。
したがって、これは ECDF プロットと同じ構造であり、唯一の違いは Seaborn 変数にあり、ECDF プロットを渡し、色相を日として使用します。ただし、その色合いをスモーカーなどの別のカテゴリに変更することもできます。
このカテゴリを渡すと、2 つの異なる線を持つ ECDF プロットが作成されます。これらの分布では、喫煙者の方が特定の線幅についてより多くの意見を持っていることがわかります。
非喫煙者はそのデータの 100% が 6 ドル未満ですが、喫煙者のデータは 6 ドルです。興味深いことに、喫煙者は特定の日に多額のチップを残していく可能性があります。
ECDF プロットのスタイル設定
ここで、ECDF プロットをさらにスタイル設定して、より見栄えの良いものにすることができます。下の画像には、さまざまな ECDF プロットが示されています。最初のプロットでは、線を大きくし、別のカラー パレットを使用しました。
最初のプロットでは、関数内でさまざまなパラメーターを使用しました。以下に示すように、パレットを 夏 、線幅を 5 として渡しました。
土曜と日曜も比較したので、緑色の線が2本あるのです。ここでは、3 ドルのチップが日曜日の 45 パーセンタイル、木曜日の 70 パーセンタイルにあることがわかります。これは、人々が日曜日に高額のチップを残す傾向があることを示しています。
下の画像のように、X 軸と Y 軸を切り替えたり、プロット内の比率と先端を交換したり、パレットを変更したりすることもできます。
ここでは、2 ドルのチップが日曜日の 20 パーセンタイル (プロット内の紫色の線) にあることがわかります。したがって、データは前の ECDF プロットと同じであり、表示のみが異なります。
同じデータセットを含む別のプロットが作成され、上の画像に示すように元の軸の位置が保持されます。今回の違いは、線の方向が反転していることです。
ECDF プロット スタイル
コードを見ると、私たちが行っているのは、パラメータの 補完 = true を渡しているだけです。 このアクションにより、 2 ドルの範囲未満ではデータの 20% が分散されていると言うのではなく、2 ドルの範囲以上ではデータの 80% が分散されていると言えるようになります。繰り返しますが、同じデータであっても、見た目や表示方法が異なります。
そして、4 番目で最後の ECDF プロットでは、比例の代わりにカウントを使用しています。
このアプローチは、プロットが複数ある場合に役立ちます。下の画像のカウント列を見ると、金曜日の観測値がそれほど多くないことがわかります。これは、その日に人々があまり多くのチップを残していないことを示しています。
ECDF プロット コードの基礎
コードを見ると、 この特定のプロットを作成するための主要な部分であるSeabornが見つかります。スタイル設定用のmatplotlib.pyplotもあり 、 plt という変数として保存できます 。
次に、その変数を使用して、タイトルやフォント サイズの追加など、特定のプロットにさまざまなスタイルを作成できます。コードの主要部分は、Seaborn に組み込まれた ECDF プロット関数になります。
R スクリプトの散布図: Python ユーザー定義関数を作成およびインポートする方法| R の GGPLOT2 の概要
: ESQUISSE を使用した視覚化
結論
以上が、ヒストグラム、KDE、ボックス、ECDF プロットなど、さまざまな分布プロットを使用する方法でした。また、同じデータセットを使用して ECDF プロットを表示する 4 つの方法についても学習しました。好みに応じて、任意のアプローチを使用できます。
プロットの作成に必要なライブラリを取り込み、適切な関数を使用することを常に忘れないでください。その後は、軸の位置や色合いなど、プロットの視覚的およびスタイル的な側面を変更するだけです。
ではごきげんよう、
Python における Self とは: 実際の例
R の .rds ファイルからオブジェクトを保存および読み込む方法を学習します。このブログでは、R から LuckyTemplates にオブジェクトをインポートする方法についても説明します。
この DAX コーディング言語チュートリアルでは、GENERATE 関数の使用方法とメジャー タイトルを動的に変更する方法を学びます。
このチュートリアルでは、マルチスレッド動的ビジュアル手法を使用して、レポート内の動的データ視覚化から洞察を作成する方法について説明します。
この記事では、フィルター コンテキストについて説明します。フィルター コンテキストは、LuckyTemplates ユーザーが最初に学習する必要がある主要なトピックの 1 つです。
LuckyTemplates Apps オンライン サービスが、さまざまなソースから生成されたさまざまなレポートや分析情報の管理にどのように役立つかを示したいと思います。
LuckyTemplates でのメジャー分岐や DAX 数式の結合などの手法を使用して、利益率の変化を計算する方法を学びます。
このチュートリアルでは、データ キャッシュの具体化のアイデアと、それが結果を提供する際の DAX のパフォーマンスにどのように影響するかについて説明します。
これまで Excel を使用している場合は、ビジネス レポートのニーズに合わせて LuckyTemplates の使用を開始するのに最適な時期です。
LuckyTemplates ゲートウェイとは何ですか? 知っておくべきことすべて