【データサイエンス入門講座】 第3回(順列と組み合わせ)

データサイエンス入門講座とは?

こちらの講座では、データサイエンティスト協会様がリリースしている「データサイエンティストのためのスキルチェックリスト」に沿った解説を行っていきます。

「データサイエンティストのためのスキルチェックリスト」とは、データサイエンティストとして活躍するために必要なスキルが体系化されたものです。

 

このデータサイエンス入門講座に従って学習していくと、データサイエンティストに必要なスキルセットである「データサイエンス力」を一通り学習することが出来ます。

データサイエンス入門講座の記事一覧はこちら

今回勉強するデータサイエンスの範囲

第3回では、「データサイエンティストのためのスキルチェックリスト」の「データサイエンス力」項目No.3の解説になります。

多くの専門用語や公式が登場しますが丁寧に理解しやすく説明していきます。

本記事はIffat Maabさんによる英語の解説を翻訳しています。

 

Iffat Maab

東京大学大学院工学系研究科技術経営戦略学専攻(TMI)博士課程在学中。パキスタン、イスラマバード市出身。


順列と組合せの式をP、C、m、nを用いて表せる。

こちらは順列と組み合わせに関する問いです。

順列と組み合わせは混乱することが多いと思います。

そのため、混乱しないように多くの具体例を用いて解説していきます。

例えば、「山田さん、伊藤さん、田中さん」という3人の名前について見てみましょう。

上の名前の並び方は、「伊藤さん、田中さん、山田さん」とは異なります。

このように順番が重要になるときが【順列】です。1列に並べる際の並べ方の事をいいます。

順列は順序が重要な問題のためのものですが、一方で【組み合わ】では順序は重要ではありません。

例えば、組み合わせでは、「山田さん、伊藤さん、田中さん」の順番がどのようであっても構わないのです。

つまり、この3人が要素として、含まれていることが重要なのです。

そして、この順列と組み合わせの違いをより理解するために、もう一つ例を説明します。

例えば、私の携帯電話のパスワードが3478であるとしましょう。

パスワードは正確には3-4-7-8でなければなりません。

3487やその他のパスワードの数字の順番ではないので、ここでは順番が重要です。つまり、順列であり、組み合わせではありません。

 

順列の公式

n個のものの中から、r個を選んで一列に並べる際の並べ方の数はこちらの公式で求めることが出来ます。

組み合わせは英語でパーミュテーション(Permutation)なので、簡略化して頭文字のPで表されています。

全てのものを並べる際は、n!になります。!とは階乗と読み、全ての数字をかけるという意味です。

例えば、3!=3×2×1

6!=6×5×4×3×2×1

といった計算を行います。

 

順列の問題例

問題

8人の選手がレースをする場合、金メダル、銀メダル、銅メダルを渡す方法は何通りあるでしょうか。

解答

この例題では、選手の総数は8人なので、n = 8になります。

この例題では、金、銀、銅の3つのメダルを8人の選手に渡す方法が何通りあるかを聞いています。

メダルの総数は3個なので、一度に3個のメダル(物)を並べることになるので、r=3となります。

式を使って

つまり、8人のプレーヤーに金メダル、銀メダル、銅メダルを与える方法は336通りあるということになります。

 

組み合わせの公式

順番が問題にならない場合、それは組み合わせです。

組み合わせは英語でコンビネーション(combination)なので、頭文字のCで表されます。

正確には数学で、n個のものをr個取ったときの組み合わせの数は、次の式で求められます。

 

組み合わせの例(1)

問題

5つの果物の中から4個取るときの組み合わせは何通りでしょうか。

解答

この例では、全部で5つの物があるので、n=5です。

ここで、4つのものを一度に取る際の組み合わせの数は、r=4となります。

これらの値を上の式に入れると、

となり5通りであることが分かります。

組み合わせには順序の制限がないため、組み合わせの総数は順列よりも少ないことがわかります。

組み合わせの例(2)

問題

10人のグループから3人のチームを選ぶ方法は何通りありますか。

解答

まず、この例題では、3人のチームを選ぶことが求められており、一度に3つのものを扱っていることになるので、r=3となります。

また、1グループの人数は10人なので、n=10となります。

組み合わせ式の値の検討 上の式に値を入れると、組み合わせの総数は120となり、3人のチームを選ぶ方法が120通りあることになります。

これらの値を上の式に入れると、

となり、120通りであることが分かります。

 


まとめ

以上が「データサイエンス力」のNo.3の解説になります。

 

 

次回はNo.4からの解説になります。1~180項目まで順に追って解説していくので、マーケターの皆さんは本シリーズを読んで、データサイエンスの世界に踏み出していきましょう。

データサイエンス入門講座の記事一覧はこちら

2021年より、デジマールに入社。
趣味はキャンプ。

中野将志

2021年より、デジマールに入社。 趣味はキャンプ。

広告運用代行や各種支援について、
お気軽にご相談ください。
デジマールのマーケティングノウハウをご提供します。

お問い合わせはこちら