Python と LuckyTemplates で ECDF プロットを使用する方法

Python と LuckyTemplates で ECDF プロットを使用する方法

このブログでは、経験的累積分布関数または ECDF プロットとも呼ばれる累積分布プロットの使用方法を示し、他のプロット タイプと比べてこのプロットのバリエーションを使用する利点を紹介します。このチュートリアルのビデオ全体は、このブログの下部でご覧いただけます

よりも ECDF プロットを好みます。この機能により、ユーザーはプロットを簡単に操作できます。今日は、Python と LuckyTemplates で ECDF を使用する方法を学び、データ配布に関するプレゼンテーションとレポートを改善します。

目次

分布図の種類

まず、土曜日という特定の日のデータをフィルター処理します。分布を説明するために使用されるすべての Python プロットが以下に表示されます。ここには ECDF プロット、ヒストグラム、KDE ​​プロット、ボックス プロットがあります。

Python と LuckyTemplates で ECDF プロットを使用する方法

これらすべてのプロットは、データがどのように分散または分散されるかを説明します。たとえば、下に進んでヒストグラムを見ると、これらの高いビンのほとんどがデータが配置されている場所であることがわかります。

Python と LuckyTemplates で ECDF プロットを使用する方法

約 3.50 ドルで、以下のデータセットのヒントデータの最も高いビンがあります。

Python と LuckyTemplates で ECDF プロットを使用する方法

分布を調べるときに別のメトリックを提供する KDE プロットを使用することもできます。ヒストグラムはこれらのビンに入るカウントを扱いますが、KDE ​​は密度を扱います。

Python と LuckyTemplates で ECDF プロットを使用する方法

KDE プロットを使用すると、プロット内の最大の密度または最も高い膨らみを見つけることで、ほとんどのデータがどこにあるかを知ることができます。したがって、上の画像では、2 ドルから 4 ドルの間のどこかに分布していると言えます。

同じことが箱ひげ図にも当てはまり、分布が $2 ~ $4 であり、ほとんどのデータがここにあることがわかります。ボックスを分割する水平線である中央値を使用して、最大の分布がどこにあるかを知ることができます。

Python と LuckyTemplates で ECDF プロットを使用する方法

次に、ECDF プロットが表示されます。Y 軸の左側には、パーセンタイルを表すProportionという単語が表示されます。プロットに基づくと、3.50 ドルではデータの約 50% が確認され、5 ドル以下ではデータの 80% が分散されています。

Python と LuckyTemplates で ECDF プロットを使用する方法

ヒストグラム プロット コード

Python と LuckyTemplates で ECDF プロットを使用する方法

ここで、ヒストグラムから始めて、これらの各プロットのコードを示します。これらはすべて非常に類似した反復可能なコーディングを備えているため、テンプレートのように 1 つのコードを使用してそれらをすぐに取り出すことができます。

まず Seabornをインポートしてsb  として保存し 、次に matplotlib.pyplot を pltとして 保存する必要があります。 ggplotという背景スタイル  とその matplotlib 変数を使用して、さまざまなスタイルを渡します。

Python と LuckyTemplates で ECDF プロットを使用する方法

たとえば、下の画像では、11 行目にヒストグラムのタイトルと目盛りサイズを追加していることがわかります。yticks と xticks は、それ  に応じて x と y のサイズを表します。

Python と LuckyTemplates で ECDF プロットを使用する方法

14 行目では、Seaborn 変数を使用して、ヒストグラム プロットを表す上記の例のhistplot などの特定のプロットを取り込む 関数を渡します。次に、4 行目のデータをデータセットとして関数に渡します。

Python と LuckyTemplates で ECDF プロットを使用する方法

値に取り込んだものはすべてデータセットを表し、重複は削除されます。次に、 ヒントにx を使用し 色相を 使用 します 。seaborn と併用すると、データをカテゴリ別に分けることができます。ビジュアルに戻ると、「the」、「time」、「smoker」などのカテゴリがあることがわかります。

Python と LuckyTemplates で ECDF プロットを使用する方法

KDE プロット

KDE プロットの場合、すべてがほぼ同じです。シェーディングされた外観を得るには、shade という新しいパラメータを渡すだけです。それ以外は色合い、データ等は同じです。

Python と LuckyTemplates で ECDF プロットを使用する方法

箱ひげ図では、いくつかの小さな違いを除いて、他のプロットとほぼ同様です。 ここでは 、 x が日、  y がヒントである箱ひげ図関数を使用します 。 このプロットでは色相も使用していません 。

Python と LuckyTemplates で ECDF プロットを使用する方法

したがって、これは ECDF プロットと同じ構造であり、唯一の違いは Seaborn 変数にあり、ECDF プロットを渡し、色相を日として使用します。ただし、その色合いをスモーカーなどの別のカテゴリに変更することもできます。

Python と LuckyTemplates で ECDF プロットを使用する方法

このカテゴリを渡すと、2 つの異なる線を持つ ECDF プロットが作成されます。これらの分布では、喫煙者の方が特定の線幅についてより多くの意見を持っていることがわかります。

Python と LuckyTemplates で ECDF プロットを使用する方法

非喫煙者はそのデータの 100% が 6 ドル未満ですが、喫煙者のデータは 6 ドルです。興味深いことに、喫煙者は特定の日に多額のチップを残していく可能性があります。

ECDF プロットのスタイル設定

Python と LuckyTemplates で ECDF プロットを使用する方法

ここで、ECDF プロットをさらにスタイル設定して、より見栄えの良いものにすることができます。下の画像には、さまざまな ECDF プロットが示されています。最初のプロットでは、線を大きくし、別のカラー パレットを使用しました。

最初のプロットでは、関数内でさまざまなパラメーターを使用しました。以下に示すように、パレットを  、線幅を 5 として渡しました。 

Python と LuckyTemplates で ECDF プロットを使用する方法

土曜と日曜も比較したので、緑色の線が2本あるのです。ここでは、3 ドルのチップが日曜日の 45 パーセンタイル、木曜日の 70 パーセンタイルにあることがわかります。これは、人々が日曜日に高額のチップを残す傾向があることを示しています。

Python と LuckyTemplates で ECDF プロットを使用する方法

下の画像のように、X 軸と Y 軸を切り替えたり、プロット内の比率と先端を交換したり、パレットを変更したりすることもできます。

ここでは、2 ドルのチップが日曜日の 20 パーセンタイル (プロット内の紫色の線) にあることがわかります。したがって、データは前の ECDF プロットと同じであり、表示のみが異なります。

Python と LuckyTemplates で ECDF プロットを使用する方法

同じデータセットを含む別のプロットが作成され、上の画像に示すように元の軸の位置が保持されます。今回の違いは、線の方向が反転していることです。

ECDF プロット スタイル

コードを見ると、私たちが行っているのは、パラメータの 補完 = true を渡しているだけです。 このアクションにより、 2 ドルの範囲未満ではデータの 20% が分散されていると言うのではなく、2 ドルの範囲以上ではデータの 80% が分散されていると言えるようになります。繰り返しますが、同じデータであっても、見た目や表示方法が異なります。

Python と LuckyTemplates で ECDF プロットを使用する方法

そして、4 番目で最後の ECDF プロットでは、比例の代わりにカウントを使用しています。

Python と LuckyTemplates で ECDF プロットを使用する方法

このアプローチは、プロットが複数ある場合に役立ちます。下の画像のカウント列を見ると、金曜日の観測値がそれほど多くないことがわかります。これは、その日に人々があまり多くのチップを残していないことを示しています。

Python と LuckyTemplates で ECDF プロットを使用する方法

ECDF プロット コードの基礎

コードを見ると、 この特定のプロットを作成するための主要な部分であるSeabornが見つかります。スタイル設定用のmatplotlib.pyplotもあり 、 plt という変数として保存できます 。

Python と LuckyTemplates で ECDF プロットを使用する方法

次に、その変数を使用して、タイトルやフォント サイズの追加など、特定のプロットにさまざまなスタイルを作成できます。コードの主要部分は、Seaborn に組み込まれた ECDF プロット関数になります。



R スクリプトの散布図: Python ユーザー定義関数を作成およびインポートする方法| R の GGPLOT2 の概要
: ESQUISSE を使用した視覚化

結論

以上が、ヒストグラム、KDE、ボックス、ECDF プロットなど、さまざまな分布プロットを使用する方法でした。また、同じデータセットを使用して ECDF プロットを表示する 4 つの方法についても学習しました。好みに応じて、任意のアプローチを使用できます。

プロットの作成に必要なライブラリを取り込み、適切な関数を使用することを常に忘れないでください。その後は、軸の位置や色合いなど、プロットの視覚的およびスタイル的な側面を変更するだけです。

ではごきげんよう、


Python における Self とは: 実際の例

Python における Self とは: 実際の例

Python における Self とは: 実際の例

RでRDSファイルを保存してロードする方法

RでRDSファイルを保存してロードする方法

R の .rds ファイルからオブジェクトを保存および読み込む方法を学習します。このブログでは、R から LuckyTemplates にオブジェクトをインポートする方法についても説明します。

最初の N 営業日の再考 – DAX コーディング言語ソリューション

最初の N 営業日の再考 – DAX コーディング言語ソリューション

この DAX コーディング言語チュートリアルでは、GENERATE 関数の使用方法とメジャー タイトルを動的に変更する方法を学びます。

LuckyTemplates のマルチスレッド動的ビジュアル手法を使用したインサイトのショーケース

LuckyTemplates のマルチスレッド動的ビジュアル手法を使用したインサイトのショーケース

このチュートリアルでは、マルチスレッド動的ビジュアル手法を使用して、レポート内の動的データ視覚化から洞察を作成する方法について説明します。

LuckyTemplates のフィルター コンテキストの概要

LuckyTemplates のフィルター コンテキストの概要

この記事では、フィルター コンテキストについて説明します。フィルター コンテキストは、LuckyTemplates ユーザーが最初に学習する必要がある主要なトピックの 1 つです。

LuckyTemplates Online Service でアプリを使用する際の最良のヒント

LuckyTemplates Online Service でアプリを使用する際の最良のヒント

LuckyTemplates Apps オンライン サービスが、さまざまなソースから生成されたさまざまなレポートや分析情報の管理にどのように役立つかを示したいと思います。

時間の経過に伴う利益率の変化を分析する – LuckyTemplates と DAX を使用した分析

時間の経過に伴う利益率の変化を分析する – LuckyTemplates と DAX を使用した分析

LuckyTemplates でのメジャー分岐や DAX 数式の結合などの手法を使用して、利益率の変化を計算する方法を学びます。

DAX Studio でのデータ キャッシュのマテリアライゼーションのアイデア

DAX Studio でのデータ キャッシュのマテリアライゼーションのアイデア

このチュートリアルでは、データ キャッシュの具体化のアイデアと、それが結果を提供する際の DAX のパフォーマンスにどのように影響するかについて説明します。

LuckyTemplates を使用したビジネス レポート

LuckyTemplates を使用したビジネス レポート

これまで Excel を使用している場合は、ビジネス レポートのニーズに合わせて LuckyTemplates の使用を開始するのに最適な時期です。

LuckyTemplates ゲートウェイとは何ですか? 知っておくべきことすべて

LuckyTemplates ゲートウェイとは何ですか? 知っておくべきことすべて

LuckyTemplates ゲートウェイとは何ですか? 知っておくべきことすべて