さて、前回は X⇒Y の1項目の組み合わせでしたので、エクセルベースの手計算でのどうにかなりました。しかし、Xに(A,B) のような複数の組み合わせが入る相関ルールを発見する場合はどうなるでしょうか。
現在の講座数は 671個あるので、A,Bの2つの組み合わせだけで40万通りほど、A,B,Cの3とおりの組み合わせともなれば更に多くのパターンについてしらべなければなりません。
(組み合わせの最大数は、 671×670×669・・・×2×1 と671の階乗ぶんあります。これはとても短時間で求められる数ではありません。)
ここでは、その解決策のひとつとして、アプリオリアルゴリズムを紹介します。
アプリオリアルゴリズムでは、最小サポートと最小確信度という概念を利用します。
最小サポートというのは、ユーザーが与えたサポートのしきい値で、例えば、0.2%のように任意に設定します。
このようにした場合、組み合わせA,Bのサポートが最小サポートより低いのであればそれを含む組み合わせA,B,CはA,Bのサポートより必ず小さくなります。
このように、求める範囲を限定していけば全通りの組み合わせを計算しなくても、意味のある(サポートの高い)組み合わせをもれなく発見できることとなります。
コメント