Microsoft Excel: Power Query を使用して重複する値またはレコードの一覧を表示する方法 - TechRepublic

Microsoft Excel: Power Query を使用して重複する値またはレコードの一覧を表示する方法 - TechRepublic

画像: PixieMe/Shutterstock

重複レコードの良し悪しは、Excelではなく、ユーザーが設定する特定の規則によって決まります。多くの場合、同じ列内で同じ値が繰り返されるレコードが多いため、重複データはよく発生します。

参照:すべてのユーザーが習得すべき Excel のヒント 83 選(TechRepublic)

一方、すべての値が重複する重複レコードは、データセット全体のレポート作成や分析において問題を引き起こす可能性があります。重複レコードは簡単に見つけられます。データセットからフィルター処理したり、条件付き書式ルールを使用して書式設定したりできます。Excelでは、重複レコードのみを表示することは容易ではありません。しかし、Power Queryを使えば簡単に表示できます。この記事では、Power Queryを使って重複レコードの一覧を表示する方法をご紹介します。

Microsoft 365を使用していますが、Power Queryは2010までアドインとして利用可能です。Excel OnlineはPower Queryを完全にサポートしていませんが、クエリを実行することは可能です。デモ用の.xlsxファイルをダウンロードするか、ご自身のデータを使って操作することもできます。この記事では、基本的なExcelスキルがあることを前提としていますが、初心者でも手順に従えば問題なく使えるはずです。

Power Query とは何ですか?

Power Queryを使えば、外部データやローカルデータに接続し、そのデータを変換してExcelで使用できるため、元のデータを変更することなく使用できます。使い方は簡単ですが、残念ながらほとんどのユーザーは使い慣れていません。この記事ではPower Queryのシンプルな機能を使用していますが、Power Queryの基本的な使い方を解説するものではありません。それでは、実際にPower Queryを使って重複データを表示してみましょう。

重複を定義する

重複を効率的に処理するには、データの文脈において重複とは何か、そしてどのように使用するかを定義する必要があります。同じ列に複数回出現する値はすべて重複です。例えば、追跡データセットでは、多くのレコードに同じ配送日や顧客が含まれている場合があります。これらは重複値であり、よく見られます。

参照:Windows 10:音声認識とディクテーションの音声コマンド一覧(無料PDF)(TechRepublic)

この用語は、レコード内のすべての値が別のレコードで重複しているレコードも定義します。つまり、レコード全体が重複しているということです。例えば、同じ配送日、顧客、請求書番号を含む2つのレコードがあると問題が発生する可能性があります。同じ注文に対して顧客に2回請求書を発行することは望ましくありません。これらは重複レコードであり、通常はどちらか一方を削除する必要があります。

この記事では、Power Query を使用して、同じ列で繰り返される値とすべての列で繰り返される値の両方の重複タイプのリストを表示します。

図Aに示すように、デモシートには重複した値が含まれています。このような小さなデータセットであれば、重複を見つけるのは難しくありません。しかし、データセットが大きい場合は特に、重複した値の処理は別の問題となります。また、重複レコードが1つあります。

図A

Power Queryで重複値をリストする方法

Power Queryを使って、列内で重複している値を確認してみましょう。データセット内の任意の場所をクリックし、「データ」タブをクリックして、以下の操作を行います。

  1. 「データの取得と変換」グループで、「シートから」をクリックします。結果ウィンドウにPower Queryのデータが表示されます(図B)。
  2. 重複をチェックしたい列を選択します。今回は日付列が既に選択されているので、それを使用します。
  3. [ホーム] タブ (Excel ではなく Power Query) で、[行数の削減] グループの [行を保持] ドロップダウンをクリックします。
  4. 表示されるドロップダウン リストで、[重複を保持] を選択します。

図B

図Cに示すように、データセットには2つの日付が少なくとも1回は重複しています。他の列の重複を確認するには、列を選択して手順3を繰り返します。例えば、図Dは人事列の重複値を示しています。

図C

図D

これで、少なくとも2つの列で少なくとも1つの値が繰り返されていることがわかりました。必要に応じて、各列の重複を確認してください。すべての列で少なくとも1つの値が繰り返されていることがわかります。

重複したレコードがあるかどうかを確認したい場合はどうすればよいでしょうか。次にその点に取り組みましょう。

ExcelのPower Queryで重複レコードを一覧表示する方法

簡単にまとめると、重複レコードはすべての列で値が重複していることを意味します。データセットに重複レコードがないか確認するには、Power Queryですべての列を選択します。Shiftキーを押しながら各列をクリックします。次に、「行を保持」ドロップダウンから「重複を保持」を選択します。図Eに結果を示します。既にご想像のとおり、結果は前のセクションの人事クエリと同じです。

図E

確かにこれは単純な例であり、結果は容易に予測できました。しかし、特に大規模なデータセットでは、必ずしもそうとは限りません。

Power Query検索の結果を利用する方法

レコードを見るだけでは十分ではないかもしれません。幸いなことに、結果をシートとしてExcelに返すことができます。「閉じる」グループの「閉じて読み込む」をクリックするだけです。すると、図Fに示すように、新しいシートが作成され、結果のデータセットが保存されます。Excelにデータが読み込まれたら、他のデータセットと同じように使用できます。

図F

これはPower Queryの簡単な使い方です。少し時間をかけて様々なオプションに慣れ、より複雑なタスクに適用できるようにしましょう。

Tagged: