Python の相関関係: ビジュアル作成のガイド

今日のブログでは、 Python の相関関係を視覚化するプロセスと、これらのビジュアルを LuckyTemplates にインポートする方法について説明します。このチュートリアルの完全なビデオは、このブログの下部でご覧いただけます。

相関関係を理解する
Python 相関用のパッケージ
データの属性
Python 相関データセット
Python 相関: 散布図の作成
Python 相関: 回帰プロットの作成
Python 相関: 相関行列の作成
- 複数 x 単一変数の相関
Python 相関: ヒートマップの作成
- 1 つの変数を使用したヒートマップ
Python 相関: 階段ビジュアルの作成
- LuckyTemplates の階段ビジュアル
結論

相関関係を理解する

これは、さまざまな種類の相関関係を示す素晴らしい画像です。

Python の相関関係: ビジュアル作成のガイド

左から開始すると、完全な正の相関があり、相関値が 1 であることを意味します。次に、降順に正の相関が続き、0 になります。

中央のグラフには相関がないことが示されており、相関値が 0 に等しいことを示しています。

最後に、右側は 0 から減少する負の相関値を示しています。右端のグラフは、相関値が -1 の完全な負の相関です。

Python 相関用のパッケージ

このチュートリアルでは 4 つのパッケージを使用します。最初のパッケージはデータ操作に使用され、変数pdとして保存されるPandasです。

視覚化には、これらの関数を簡単に使用できるようにplt変数として保存されたMatplotlibを使用します。Seaborn、統計視覚化ライブラリはsnsとして保存されます。最後に、npとして保存されるNumpy は、線形代数に使用されます。

Python の相関関係: ビジュアル作成のガイド

データには、Seaborn のサンプルデータセットを使用します。次に、 sns 変数を使用して、以下に示すようにダイヤモンドデータセットを取り込みます。。

Python の相関関係: ビジュアル作成のガイド

データの属性

dataset.info 関数を使用してデータの属性を表示できます。この関��は、以下の最後の列にあるように、さまざまなデータ型をすべて表示します。

Python の相関関係: ビジュアル作成のガイド

相関関係は数値変数に対してのみ機能するため、ほとんどの場合は数値変数を調べることに注意してください。ただし、いくつかのカテゴリ変数を視覚化に利用する方法も学びます。

Python 相関データセット

dataset.headとして記述された関数 head を使用すると、次のようなデータの上位 5 行を取得できます。

Python の相関関係: ビジュアル作成のガイド

最初の列にはcaratがあり、その後にカテゴリ変数Cut、color、およびclarityが続き、残りのデータの数値が続きます。

Python 相関: 散布図の作成

相関関係を視覚化し、2 つの変数を確認する場合、通常は散布図を確認します。

したがって、Seaborn ライブラリを使用して、上で保存したデータをdata=datasetとして渡す散布図関数を使用して散布図を作成しました。次に、X 変数と Y 変数 (それぞれカラットと価格)を特定しました。

Python の相関関係: ビジュアル作成のガイド

これは Seaborn ライブラリを使用して作成した散布図です。

Python の相関関係: ビジュアル作成のガイド

この散布図は非常に密集していることがわかります。これは、約 54,000 行のデータがあり、ポイントが必ずしも最良の方法で表現されているわけではないためです。

Shift + Tab キーを押すと、散布図のスタイルを設定するさまざまな方法が表示されます。散布図に追加できるさまざまなパラメーターのリストが表示されます。

Python の相関関係: ビジュアル作成のガイド

さらに下にスクロールすると、リストされた各パラメーターの機能に関する情報が表示されます。

Python の相関関係: ビジュアル作成のガイド

追加の散布図パラメータ

少し詳しく見てみましょう。以下に示す最初の散布図の白い線がややわかりにくいため、 linewidth=0にできます。

Python の相関関係: ビジュアル作成のガイド

不透明度を制御できるようにアルファを調整することも必要です。例としてalpha=0.2を使用しましょう。ただし、もちろん、これを 0.1 に変更することもできます。

Python の相関関係: ビジュアル作成のガイド

これらのパラメータを追加して[実行]をクリックすると、散布図が白線なしでより不透明になることがわかります。

Python の相関関係: ビジュアル作成のガイド

パラメータを調整して、探している最高のビジュアルを得ることができます。

カテゴリ変数の使用

カテゴリ変数の一部を利用してビジュアルを改善することもできます。たとえば、データにはダイヤモンドの カットがあることがわかっています。

私たちができることは、hue='cut'としてhueパラメーターを使用してそのカットカテゴリを渡すことです。これにより、色を変更することでこれらのポイントを視覚化できるようになります。

Python の相関関係: ビジュアル作成のガイド

もちろん、アルファなどのパラメーターをさらに追加することもできます。これを再度追加して 0.2 に設定し、ビジュアルがどのように変化するかを確認します。「実行」をクリックすると、少しの違いがわかるでしょう。

Python の相関関係: ビジュアル作成のガイド

パラメータをいじって、探しているビジュアルを取得できます。また、明瞭度などのさまざまなカテゴリを使用することもできます。これにより、明瞭度のカテゴリが得られ、その散乱のわずかに異なるビューも得られます。

Python の相関関係: ビジュアル作成のガイド

他の変数との相関関係

価格とカラット以外の他の値がどのように相関しているかについても興味があるかもしれません。したがって、そのダイヤモンドとDepthの数値次元である tableの散布図を見ると、1 対 1 の線形関係がないことがわかります。

Python の相関関係: ビジュアル作成のガイド

DepthやPriceなど、他の 2 つの変数も確認できます。グラフによると、データは中央のエリアに集中していることがわかります。

Python の相関関係: ビジュアル作成のガイド

Python 相関: 回帰プロットの作成

2 つの変数間の線形関係を評価できる回帰プロットに進みましょう。

そこで、今回は散布図関数の代わりにregplot関数を使用します。同じ構造体、つまりデータ、次に X 変数と Y 変数を渡します。

Python の相関関係: ビジュアル作成のガイド

結果には、変数間の線形関係を測定する線が表示されます。また、私たちの価値観がその回帰直線の周りをどのように周回しているのかも明らかです。

Python の相関関係: ビジュアル作成のガイド

現時点ではそれほど美しいビジュアルではありませんが、より良いビジュアルを得るために最適化することができます。たとえば、Matplotlib 変数を使用してスタイルを渡すことができます。コード plt.style.use('dark_background') を使用して、スタイルを暗い背景に変更できます。

Python の相関関係: ビジュアル作成のガイド

同じ回帰プロットを取得し、散布図と線にいくつかのキーワードを渡します。回帰直線に赤の色と 1 の線幅を使用してみましょう。これはline_kws={“color” : “red”, 'linewidth' : 1) と書きます。

散布キーワードでは、色を白、エッジの色をグレー、不透明度を 0.4 に設定して、scatter_kws ={“color” : “white”, 'edgecolor' : 'grey', 'alpha' : 0.4 と書きます。）。

Python の相関関係: ビジュアル作成のガイド

これらのパラメータにより、以下に示す少し異なるビューが得られます。

Python の相関関係: ビジュアル作成のガイド

Python 相関: 相関行列の作成

これまでのところ、2 つの変数のみを含む散布図を見てきましたが、すべての変数の相関関係も調べたい場合があります。

これは、dataset.corr として表される相関と呼ばれるデータフレーム関数を備えたデータセットを使用して実行されます。そして、これらの各変数の相関関係を示す行列が得られます。

Python の相関関係: ビジュアル作成のガイド

上の表の数値は、これらすべての変数間の線形関係に焦点を当てたピアソン相関関係を表しています。

ただし、変数が完全に線形相関しているかどうかがわからない場合は、線形部分よりも影響力に重点を置いた、別のタイプの相関関係を使用できます。これはスピアマン相関と呼ばれます。

Python の相関関係: ビジュアル作成のガイド

Shift + Tab を押すと、これらすべてに関する情報を確認できます。下にスクロールすると、スピアマンの順位相関、ピアソンの相関係数、およびデータを測定するさまざまな方法が表示されます。

Python の相関関係: ビジュアル作成のガイド

先ほどの相関行列を振り返ると、価格とカラットがかなりよく相関していることがわかります。

Python の相関関係: ビジュアル作成のガイド

これらはここでのプロットからのもので、0.92 で非常に線形であることがわかります。

Python の相関関係: ビジュアル作成のガイド

代わりにスピアマン相関を使用すると、影響またはランクは 0.96 と少し高くなります。

Python の相関関係: ビジュアル作成のガイド

これらのさまざまなタイプの相関により、これらの変数間の相関のさまざまな属性を検出できるようになります。

複数 x 単一変数の相関

すべての変数と 1 つの変数 (たとえば、価格) だけの相関関係の方が気になるため、行列を見たくない場合があります。

次にできることは、dataset.corrに続いて'price'を使用して価格を分離することです。

Python の相関関係: ビジュアル作成のガイド

この表では、価格がすべてのさまざまな数値変数と相関していることがわかります。これを行う理由は、視覚的なプロットのためです。

それでは、ヒートマップを使用して相関行列を視覚化してみましょう。

Python 相関: ヒートマップの作成

関数 sns.heatmap を使用して、この相関変数を Seabornヒートマップに渡すことができます。

Python の相関関係: ビジュアル作成のガイド

これにより、次のようなヒートマップが得られます。

Python の相関関係: ビジュアル作成のガイド

ここでも、設定にパラメータを追加できます。パラメータlinewidths=1を渡し、 annot=Trueを使用して注釈を追加できます。

Python の相関関係: ビジュアル作成のガイド

そして、ヒートマップがまったく異なって見えることがわかります。現在、非常に優れたヒートマップができています。

Python の相関関係: ビジュアル作成のガイド

線と注釈を追加することの有用性がわかります。繰り返しますが、Shift + Tab を押すと、そこに入力できるさまざまなパラメータがすべて表示されます。

次に、コードに method='spearman 'を追加してみてください。そうすれば、ユースケースに応じて異なるタイプの相関関係を使用する方法がわかります。

Python の相関関係: ビジュアル作成のガイド

1 つの変数を使用したヒートマップ

次に、1 つの変数を分離し、負から正への相関関係を示すヒートマップを作成します。

Python の相関関係: ビジュアル作成のガイド

これにより、以下のヒートマップが得られます。

Python の相関関係: ビジュアル作成のガイド

もちろんスタイリングも変えることができます。たとえば、cmapパラメーターをcmap='coolwarm'として使用できます。これにより、色が寒色と暖色に変わり、黒い背景も除去されます。

Python の相関関係: ビジュアル作成のガイド

「実行」をクリックすると、以下のヒートマップが表示されます。涼しい場合は青のバーがあり、暖かい場合は赤いバーがあります。

Python の相関関係: ビジュアル作成のガイド

方向を変更して、マップをカラーバーに揃えることもできます。これを行うには、sort_valuesパラメーターを編集し、ascending=Falseを追加します。

Python の相関関係: ビジュアル作成のガイド

これは、最も相関性の高いもの (赤いバー) から最も相関性の低いもの (青いバー) まで進みます。

Python の相関関係: ビジュアル作成のガイド

Python 相関: 階段ビジュアルの作成

の相関関係を視覚化する高度な方法の 1 つは、マスクを使用して、すでに行ったすべての相関関係をブロックすることです。

Numpy を使用してこれを行うことができ、いくつかの TRUE 関数と FALSE 関数を使用して、相関関係の階段を視覚化します。

Python の相関関係: ビジュアル作成のガイド

結果は次のようになります。

Python の相関関係: ビジュアル作成のガイド

これを LuckyTemplates にパイプする方法を見てみましょう。

LuckyTemplates の階段ビジュアル

まず、LuckyTemplates を開きます。別のビジュアルを確認できるように、アボカドデータセットを導入しました。このデータセットは [フィールド] ペインに表示されます。[視覚化] ペインの下にある Pythonアイコンをクリックして、Python ビジュアルを初期化します。

Python の相関関係: ビジュアル作成のガイド

?で示されるすべての数値変数を追加してデータセットを作成する必要があります。。これらの変数の横にあるチェックボックスをクリックして変数を追加します。

Python の相関関係: ビジュアル作成のガイド

データセットができたので、Jupyter ノートブックに移動して、先ほど作成したこのコードをコピーします。

Python の相関関係: ビジュアル作成のガイド

次に、コードを LuckyTemplates の Python スクリプトエディターにコピーします。

Python の相関関係: ビジュアル作成のガイド

次に、ビジュアルを選択します。これは階段のビジュアルです。Jupyter に戻り、階段のビジュアルに使用したコードをコピーします。

Python の相関関係: ビジュアル作成のガイド

コードを Python スクリプトエディターに貼り付けます。

Python の相関関係: ビジュアル作成のガイド

最後に、Python スクリプトで必要なplt.showを使用していることを確認します。コードの最後の行にplt.showを追加し、スクリプトエディターの右上隅にある実行アイコンをクリックします。

Python の相関関係: ビジュアル作成のガイド

より大きなビジュアルにするには、ボックスを少し引き伸ばして、隅で実行されているスクリプトが見えるようにします。ヒートマップのビジュアルが完成しました。これは非常に見栄えがします。

Python の相関関係: ビジュアル作成のガイド

そして、LuckyTemplates では、データセットに応じてそのビジュアルがどのように変化するかを明確に確認できます。たとえば、[視覚化] ペインの[スライサー]アイコンをクリックして、 [フィールド] ペインの [入力]に移動できます。

これにより、データセット内に従来型とオーガニック型の 2 つのタイプが得られます。1 つのタイプ (たとえば、organic)をクリックすると、ヒートマップが変化することがわかります。

Python の相関関係: ビジュアル作成のガイド

次に従来型をクリックしても変更が適用されます。

Python の相関関係: ビジュアル作成のガイド

これらのフィルターを機能させるには、Pythonスクリプトのデータセットにカテゴリ変数が必要であることに注意してください。ご覧のとおり、作成したデータセットにはtype が含まれており、その方法でビジュアルをフィルターできるようになりました。

Python の相関関係: ビジュアル作成のガイド

Python での LuckyTemplates テキスト分析でのデータモデルの関係の構築
| はじめに
LuckyTemplates データレポートでの Python スクリプト

結論

このブログでは、ピアソン相関やスピアマン順位相関などのさまざまな方法を使用して、Python と LuckyTemplates で相関関係を視覚化する方法を学習しました。

散布図、回帰プロット、相関行列、ヒートマップ、階段ビジュアルを作成して、データセットに最適なビジュアルを取得できるようになりました。さまざまなパラメータを使用して、スタイルやビジュアルを改善することもできます。

ではごきげんよう、

Power Automate の文字列関数: Substring と IndexOf

Microsoft フローで使用できる 2 つの複雑な Power Automate String 関数、substring 関数とindexOf 関数を簡単に学習します。

LuckyTemplates でビジュアルツールチップを作成する

LuckyTemplates ツールチップを使用すると、より多くの情報を 1 つのレポートページに圧縮できます。効果的な視覚化の手法を学ぶことができます。

Power Automate で HTTP 要求を行う

Power Automate で HTTP 要求を作成し、データを受信する方法を学んでいます。

LuckyTemplates で日付テーブルを作成する方法

LuckyTemplates で簡単に日付テーブルを作成する方法について学びましょう。データの分析と視覚化のための効果的なツールとして活用できます。

2 つの方法による SharePoint 列の検証

SharePoint 列の検証の数式を使用して、ユーザーからの入力を制限および検証する方法を学びます。

SharePoint リストを Excel または CSV ファイルにエクスポート

SharePoint リストを Excel ファイルおよび CSV ファイルにエクスポートする方法を学び、さまざまな状況に最適なエクスポート方法を決定できるようにします。

Power Automate のオンプレミスデータゲートウェイ

ユーザーがコンピューターから離れているときに、オンプレミスデータゲートウェイを使用して Power Automate がデスクトップアプリケーションにアクセスできるようにする方法を説明します。

DAX 数式での LASTNONBLANK の使用

DAX 数式で LASTNONBLANK 関数を使用して、データ分析の深い洞察を得る方法を学びます。

CROSSJOIN 関数の使用方法 – LuckyTemplates および DAX チュートリアル

LuckyTemplates で予算分析とレポートを実行しながら、CROSSJOIN 関数を使用して 2 つのデータテーブルをバインドする方法を学びます。

TREATAS 関数を使用して LuckyTemplates で仮想リレーションシップを作成する

このチュートリアルでは、LuckyTemplates TREATAS を使用して数式内に仮想リレーションシップを作成する方法を説明します。

Python の相関関係: ビジュアル作成のガイド

Leave a Comment

Power Automate の文字列関数: Substring と IndexOf

LuckyTemplates でビジュアル ツールチップを作成する

Power Automate で HTTP 要求を行う

LuckyTemplates で日付テーブルを作成する方法

2 つの方法による SharePoint 列の検証

SharePoint リストを Excel または CSV ファイルにエクスポート

Power Automate のオンプレミス データ ゲートウェイ

DAX 数式での LASTNONBLANK の使用

CROSSJOIN 関数の使用方法 – LuckyTemplates および DAX チュートリアル

TREATAS 関数を使用して LuckyTemplates で仮想リレーションシップを作成する

LuckyTemplates でビジュアルツールチップを作成する

Power Automate のオンプレミスデータゲートウェイ