ブログの記事を書く際に集計したデータを使用したい時があるのですが、その際にスプレッドシートを活用しています。
エクセルでは使用できない関数でめっちゃ便利なものがあり、今回はそれを使用して「重複削除」と「重複件数カウント」を行います。
※スプレッドシートに関しては無料で使えるエクセル『Googleスプレッドシート』をごらんください。
重複削除を行う
重複削除としても、実際にデータを削除してしまうと他の集計に悪影響が出てしまいます。
削除を行わずに重複なしデータを抽出する『UNIQUE関数』というモノがあります。
(1)まずはデータを用意します。今回は下記のように私の好きなミュージシャンの方のカヴァー曲動画一覧を使用します。この表の『D列:歌手』には様々な歌手名が記入されていますが、これらをユニークデータにします。
(2)先の表とは別のシートで作業したいので、右下の「+(プラス)」マークでシートを作成します。今回はすでに用意してある『抽出』シートを使用します。
(3)(2)で作成したシートのA3以降に重複削除されユニークになった歌手一覧を表示させます。
(4)3Aに『 =UNIQUE(DB!D2:D) 』と入力します。
※()の中のセル指定箇所はご自身のデータに合わせてください。
下記のように重複のないユニークな歌手一覧が表示されました。
重複をカウントする
続いて、重複をカウントします。
イメージとしては下記のように、抽出元の歌手一覧にはどのくらいの重複があるのかを計測します。
(1)B3に『=COUNTIF(DB!D2:D,A3) 』と入力します。
(2)B3に入力した関数を、ドラックして複製します。
これで重複のカウントができます。
おわりに
と、いうことでスプレッドシートで重複削除&重複件数の洗い出しするでした。
スプレッドシートには他にもたくさんの便利機能があるので、紹介していきたいと思います。
この記事のスクショ元のスプレッドシート『STGVのカヴァー曲まとめ(スプレッドシート関数サンプル)』、『STGVのカヴァー曲まとめ(スプレッドシート関数サンプル)_再生数定点』で公開してます。
他にもいろいろな関数を使用してますので、参考に見て行ってください。
このスプレッドシートで収集・集計しているのは、私の応援している大分県の仲良しミュージシャンSTGVのメンバーの方がYouTubeチャンネルにアップしているカヴァー曲の情報です。
データを使用して、カヴァー曲のまとめ記事を書いています。
『おすすめカヴァーが付いている記事一覧』でまとめています。好きな曲、アーティスト、ジャンルがあったらぜひぜひ聴いていってください。
コメント