Python における Self とは: 実際の例
Python における Self とは: 実際の例
今日は引き続き、R Notebookを使った研究のコミュニケーションについてお話します。私たちは、R を使用して研究成果を伝達するために使用できる基本的なフレームワークの開発に引き続き取り組んでいきます。再現可能な研究の伝達に関するこのシリーズの最初の部分については、ここをチェックしてください。
目次
仮説を立てる
私たちのレポートの次のステップは、仮説を立てることです。ビューア ペインに別のセクションを作成し、他のセクションを折りたたんで、高レベルのレポートを確認できるようにします。
仮説として、CD-ROM の有無にかかわらずコンピュータの販売価格に差はない、と書きます。
R ノートブックでのメソッドの作成
メソッドに進み、その仮説に答えるために使用する実際のテクニックについて説明します。いかなる種類の推論統計も行う必要はないかもしれません。対象読者に応じて、このシナリオでは高度な調査レポートを作成します。
95%の信頼水準でサンプルテストを実施し、価格の分布を視覚的に検査すると言うことになります。ほぼ正常であれば検査を実施します。
仮説とメソッドを保存した後、 [プレビュー]タブからそれらをHTML ファイル、PDF ドキュメント、またはWord ドキュメントとしてレンダリングできます。
これを HTML として送信すると、レンダー ボックスに表示される内容が表示されます。
ここには出力が作成されたことが示されているので、ファイル エクスプローラーに移動してこれを確認してみましょう。これを HTML ファイルで開くと、[プレビュー] ボタンで表示したものとよく似ていることがわかります。
現時点ではエラー メッセージは表示されず、カスタマイズの余地もあります。これらのツールとR MarkdownおよびR Notebooksを使用して、本や Web サイト全体を作成することもできます。
スクリプトに戻って作業を続けましょう。使用した方法と結果を書き留めます。私たちは基本的に計画をオープンソース化しており、何が定着するかを確認するためだけに物事を壁に突きつけているわけではないことを明確にしています。データにアクセスするときに即興で作っているわけではありません。実は計画があるのです。
いろいろなことを試してみることにはメリットもありますよね?しかし、このアプローチでは、私たちは意図的に「これをやります、そしてそれを実行します」と言っています。
R Notebook での記述統計の作業
記述統計を行ってみましょう。CD-ROM ありとなしの各グループの価格を調べたいと思います。これを行うにはいくつかの方法があります。このグループを summaryと呼び、このパイプ演算子を導入します。パイプ演算子に詳しくない場合は、前に説明したリソースを確認してください。
次に、レコードを集計してカウントし、平均価格 = 平均価格を見つけます。最後に、このグループの概要を印刷して実行します。
さあ、いくぞ。これでテーブルが完成しました。
前に述べたように、各グループに観測値がいくつあるか、平均価格がいくらかを知りたいのです。インライン参照を使用すると、これを完全に動的にすることができます。
グループの要約を実行し、tidyverse操作を使用します。この行をフィルタリングし、これらの値の 1 つを取得して、ここでのインライン参照で実際にレンダリングされるものに変換します。
保存後、「ノートブックのプレビュー」に移動して結果を確認します。
R Notebook でのビジュアライゼーションの構築
R は視覚化機能で非常によく知られています。視覚化にはggplot を使用します。価格を X 軸に配置して、ヒストグラムを作成します。また、ファセットの小さな倍数も作成します。これは、実際にはggplotで非常に簡単に行うことができます。
ここでは、タイトル、背景、色など、多くのことを変更できます。これを保存すると、プロットが表示されます。これは現時点ではインタラクティブではありませんが、R でインタラクティブにする方法はたくさんあります。この例では、静的なプロットだけを実行します。
結果は釣鐘曲線分布のようなものを示しています。これは、分析を続行する必要があることを意味します。
T 検定の結果を実行し、レポートに組み込みます。別の R チャンクを追加し、それをcd_testと呼びます。これを今実行すると、結果には多くの情報が含まれるため、そこから個々の要素を取り出すのは非常に困難になります。
これを表形式にまとめるために、tidy 関数を使用します。cd_testをきちんと実行すると、すべてが適切なテーブル構造に変わります。これを印刷して実際にレポートに表示することもできます。
もう 1 つできることは、信頼区間の下限値と上限値を見つけることです。これは単なる演出なので、この部分は見せたくないのです。
全体として、これはライブで動的なドキュメントのように見え、個々のデータ ポイントやテーブルをコピーしてレポートに貼り付けるよりもはるかに優れています。これを同僚に送信できます。理想的には、同僚は「プレビュー」をクリックするだけで、あなたが何をしたかを知り、これを基に構築できるようになります。
結論で終わる
レポートも終わりに近づいてきたので、結論を書きます。
リソースを示す付録をここに含めることもできます。付録があることの良い点は、これを誰かに提示したり見せたりしたときに、データ ソースが誰なのか、または何かがどのように測定されたのかを尋ねられることです。これらはすべて有効な質問であり、リソースが記載された付録があると、付録を指すだけで済むため、非常に役立ちます。
画像を含めたり、代替テキストを使用したりすることもできます。これは、画像が何を示しているかを基本的に説明するための良い習慣です。HTML ユーザーの場合は、HTML を使用してこの画像を埋め込むことができます。
結論
このチュートリアルでは、実際にレポート全体を調べました。これは非常に大まかなドラフトですが、R Markdown を使用して調査レポートの構造を作成することができました。
私たちは、すべてが文書化される再現性について話すことから始めました。R Markdown とこのフレームワークを使用して、Web サイト、書籍、ブログなどを作成できます。アナリストとして構築する必要があるほとんどすべての種類の製品は、RStudio を使用して作成できます。
さらに詳しく知りたい場合は、私の著書『Advancing into Analytics』を参照してください。これは、Excel、Python、R を使用したデータ分析と統計分析の優れた基本的な入門書です。Power BI ユーザー向けの Rに関するコースも用意しています。いつかこのシリーズの 3 番目のコースも登場するかもしれません。
この R Notebook チュートリアルからいくつかのことを学んでいただければ幸いです。また、これらのツールを最終的にどのように使用するか見てみたいと思います。
ジョージ・マウント
Python における Self とは: 実際の例
R の .rds ファイルからオブジェクトを保存および読み込む方法を学習します。このブログでは、R から LuckyTemplates にオブジェクトをインポートする方法についても説明します。
この DAX コーディング言語チュートリアルでは、GENERATE 関数の使用方法とメジャー タイトルを動的に変更する方法を学びます。
このチュートリアルでは、マルチスレッド動的ビジュアル手法を使用して、レポート内の動的データ視覚化から洞察を作成する方法について説明します。
この記事では、フィルター コンテキストについて説明します。フィルター コンテキストは、LuckyTemplates ユーザーが最初に学習する必要がある主要なトピックの 1 つです。
LuckyTemplates Apps オンライン サービスが、さまざまなソースから生成されたさまざまなレポートや分析情報の管理にどのように役立つかを示したいと思います。
LuckyTemplates でのメジャー分岐や DAX 数式の結合などの手法を使用して、利益率の変化を計算する方法を学びます。
このチュートリアルでは、データ キャッシュの具体化のアイデアと、それが結果を提供する際の DAX のパフォーマンスにどのように影響するかについて説明します。
これまで Excel を使用している場合は、ビジネス レポートのニーズに合わせて LuckyTemplates の使用を開始するのに最適な時期です。
LuckyTemplates ゲートウェイとは何ですか? 知っておくべきことすべて