機械学習に関する次の記述のうち、最も適切なものはどれか。
@ 階層併合的クラスタリングは、知識表現として述語論理を用い、演繹推論の逆を機械的に実施するものである。
A 交叉検証法は、定められた一定数のデータをランダムに抜き取り、残ったデータで学習を行い、抜き取ったデータで学習結果を評価する方式である。
B 根から葉までのパス長の総和を最小とする決定木は、データ数に依存しない計算量 (O(1)) で構築できる。
C 相関ルール (association rule) の支持度 (support) とは、ルールの条件部が起こったときに結論部が起きる割合を示している。
D ブートストラップ法は、所与の属性の中から、当面の課題解決に有効な属性を選択するための方法であり、大きく分けてフィルタ法とラッパ法の2つがある。
A
@ クラスタは同種のものの塊と考えるとよい。階層併合的クラスタリングは、複数のクラスタの状態から開始して、よく似たクラスタ同士を併合し、併合されたクラスタ間でまたよく似たクラスタ同士を併合し、最終的に1つのグループになるまで繰り返す手法である。
A 正しい。
B 決定木は分岐を繰り返すため、データ量に依存する。
C アソシエーション分析は、相関ルールを効率的に見つけ出す方法であり、支持度と信頼度に基づいて分析する。
支持度は、「商品Aを買う時、商品Bも一緒に買う」といった、ルールの出現率のことである。
信頼度は、ルールの条件部が起こったときに結論部が起きる割合のことである。
D ブートストラップ法は、標本データから重複を許したサンプリングを何度も行うことで、新たな標本集団を作成し、母集団の性質を分析することである。
特徴選択は、所与の属性の中から、当面の課題解決に有効な属性を選択するための方法である。
T−4 | 目次 | T−6 |