Power Automate の文字列関数: Substring と IndexOf
Microsoft フローで使用できる 2 つの複雑な Power Automate String 関数、substring 関数とindexOf 関数を簡単に学習します。
このチュートリアルでは、単語のさまざまな要素をグループ化するために使用されるメソッドであるPythonの見出し語化について説明します。見出し語化は、単語の語形変化を減らすことも目的としており、単語の見出し語が意味する語の語根または基本形を提供することに重点を置いています。
目次
見出語化とステミング
見出し語化はステミングに似ており、単語の語尾変化を軽減する機能もあります。唯一の違いは、見出し語化では結果として辞書ベースの単語が使用されることです。
一方、ステミングでは語形変化した単語から接辞が削除されるだけなので、単語が存在しない可能性があります。
たとえば、単語Studiesに対してステミングを利用すると、単語Studiesから接尾辞es を削除することを目的としているため、単語Study が出力として得られます。
一方、見出し語化を利用すると、単語の基本形を提供することに重点が置かれるため、結果として単語の学習が行われます。
見出語化を利用する際に考慮すべきこと
Python での見出し語化の準備段階
見出し語化の実装に進む前に、 textblobからWordライブラリをインポートすることから始めましょう。
次に、単語オブジェクトを作成します。
Word オブジェクトを作成するために、 wという名前の変数を作成しました。次に、 octopusという単語の複数形である octopi という単語オブジェクトを保持する Word ライブラリを保存しました。 Word ライブラリを使用して要素を渡すときは、その要素を一重引用符で囲むことが重要であることに注意してください。
変数wを初期化して、作成したばかりの単語オブジェクトが保持されているかどうかを確認してみましょう。
w変数を実行すると、結果として単語オブジェクトoctopiが得られます。
Python での見出し語化の実装
次に、 .lemmatize関数を使用して見出し語化を実装します。
このステップでは、単語オブジェクトoctopiを保持するw変数を使用し、 .lemmatize関数を利用して見出し語化を適用しました。その結果、octopiという単語の語根または基本形であるoctopusという単語が得られました。
その後、better という単語で見出し語化を適用してみましょう。
前の例では、 word オブジェクトをoctopiからbetterに更新しました。次に、.lemmatize関数を使用してこれを見出し語化しました。したがって、得られた結果は、使用した単語オブジェクトと同じになります。
.lemmatize 関数を使用すると、品詞を渡すことで見出し語化の方法を変更できます。例として、品詞の形容詞を表す .lemmatize 関数に aを渡してみます。
.lemmatize 関数に品詞を追加すると、結果として適切な基本単語を取得できます。
word オブジェクトを再度runningに変更しましょう。また、.lemmatize 関数に渡す品詞を動詞を表すvに変更しましょう。
変更を加えて .lemmatize 関数を初期化すると、結果としてrunという単語のルート単語が取得されました。レンマタイザのほとんどは、.lemmatize 関数を使用して行った方法を実行できません。
ただし、.lemmatize 関数は、 Python で特定の種類のテキスト分析を実行して単語の基本形式を取得するときに利用できる重要なツールです。
LuckyTemplates で Python スクリプトを使用する方法
Python でサンプル データセットを読み込む方法
Python ユーザー定義関数 | 概要
結論
簡単に言うと、 Pythonでの見出し語化の使用法とその仕組みを理解できました。見出し語化とステミングの類似点と相違点についても説明しました。Wordライブラリを使用して Word オブジェクトを作成することや、 .lemmatize関数の利用方法についても説明します。
さらに、.lemmatize 関数でさまざまな品詞を適用する方法を学びました。日常のテキスト分析タスクに見出語化を実装すると、特定の単語のベース単語を検索する時間と労力が大幅に軽減されます。
ではごきげんよう、
ガリム
Microsoft フローで使用できる 2 つの複雑な Power Automate String 関数、substring 関数とindexOf 関数を簡単に学習します。
LuckyTemplates ツールチップを使用すると、より多くの情報を 1 つのレポート ページに圧縮できます。効果的な視覚化の手法を学ぶことができます。
Power Automate で HTTP 要求を作成し、データを受信する方法を学んでいます。
LuckyTemplates で簡単に日付テーブルを作成する方法について学びましょう。データの分析と視覚化のための効果的なツールとして活用できます。
SharePoint 列の検証の数式を使用して、ユーザーからの入力を制限および検証する方法を学びます。
SharePoint リストを Excel ファイルおよび CSV ファイルにエクスポートする方法を学び、さまざまな状況に最適なエクスポート方法を決定できるようにします。
ユーザーがコンピューターから離れているときに、オンプレミス データ ゲートウェイを使用して Power Automate がデスクトップ アプリケーションにアクセスできるようにする方法を説明します。
DAX 数式で LASTNONBLANK 関数を使用して、データ分析の深い洞察を得る方法を学びます。
LuckyTemplates で予算分析とレポートを実行しながら、CROSSJOIN 関数を使用して 2 つのデータ テーブルをバインドする方法を学びます。
このチュートリアルでは、LuckyTemplates TREATAS を使用して数式内に仮想リレーションシップを作成する方法を説明します。