Power Query 重複データの削除
2024/08/05
業務改善コンサルティング会社がお届けする、今回はExcelのPower Queryの第二十四回目です。
データ分析でよく直面する問題の一つに、重複データの存在があります。今回はPower Queryを使用して、請求データから不要な重複を効率的に削除する方法を学びます。特に、「顧客ID」や「品番」の重複を見つけ出し、これをどのように処理するかを詳しく説明します。
【顧客IDの重複削除】
1.請求データのPower queryエディターを表示させます。
(請求データには、顧客ID・品番の他、売上の日付・量・単価等のデータが入っていますが、今回は、顧客IDを使用して重複データの削除を行います。)
2.顧客IDを昇順に並び替えることで、データの確認が容易になり、重複を見つけやすくなります。
顧客IDの「▼」をクリックし、「昇順で並び替え」を選択します。顧客ID「329」のデータが複数存在していることが分かります。
3.それでは、顧客IDの重複データを削除しましょう。「顧客ID」を右クリックし、「重複の削除」を選択します。
4.顧客IDの重複データが削除されたことが確認できます。
顧客ID「329」を確認すると、ひとつのデータのみが残りました。
【顧客IDと品番の重複削除】
1.請求データのPower queryエディターを表示させます。
(請求データには、顧客ID・品番の他、売上の日付・量・単価等のデータが入っていますが、今回は、「顧客ID」と「品番」を使用して重複データの削除を行います。)
2.顧客IDと品番をそれぞれ昇順に並び替えましょう。
・顧客IDの「▼」をクリックし、「昇順で並び替え」を選択します。
・品番の「▼」をクリックし、「昇順で並び替え」を選択します。
顧客ID「329」且つ品番「1GC-7B9SR」・・・等の重複データが複数存在していることが分かります。
3.「顧客ID」と「品番」の組み合わせの重複したデータが、削除されたことが確認できます。顧客ID「329」に対して、品番のデータが一意であることが分かります。
これで、Power Queryを使用して重複データを削除する基本的な方法をマスターしました。この技術を活用して、データセットをよりクリーンに整理し、分析の正確性を向上させることができます。
----------------------------------------------------------------------
シンクインク株式会社
〒650-0003
兵庫県神戸市中央区山本通2丁目13番15号 WALLSQUARE北野坂
電話番号 : 070-8977-1172
兵庫で効果のある業務効率化
----------------------------------------------------------------------