【ML笔记】假设空间、版本空间


1.1、假设空间

监督学习的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。模型属于由输入空间到输出空间的集合,这个集合就是假设空间。我们可以将学习过程看作是一个在所有假设组成的空间进行搜索的过程,搜索目标是找到与集合匹配的假设。

1.2、版本空间

与训练一致的“假设集合”

1.3、例子

假定我们已获得如下表的训练数据集

先来求假设空间: 这里我们的假设空间由形如“(色泽=?)^(根蒂=?)^(敲声=?)”的可能取值所形成的假设组成。 色泽有“青绿”和“乌黑”两种取值,还需考虑无论色泽取什么值都合适的情况,用通配符(*)表示。色泽属性共三种取值; 根蒂有“蜷缩”、“硬挺”和“稍蜷”三种取值,同理再加通配符(*)表示,根蒂属性共四种取值; 敲声有“浊响”、“清脆”和“沉闷”三种取值,同理再加通配符(*)表示,敲声属性共四种取值; 还有一种假设组成——可能”好瓜”这个概念就不成立,我们用∅表示这种假设。 那么,所对应的假设组成的个数为:3x4x4+1=49. 即表1所对应的假设空间的规模大小为49. 其中: 具体假设: 2x3x3=18 种 一个通配符:2×3+3×3+2×3=21种 两个通配符:2+3+3=8 种 三个通配符:1种 概念不存在:1种 以下列出该假设空间中的所有假设组成:

(1)(色泽=青绿)^(根蒂=蜷缩)^(敲声=浊响) (2)(色泽=青绿)^(根蒂=蜷缩)^(敲声=清脆) (3)(色泽=青绿)^(根蒂=蜷缩)^(敲声=沉闷) (4)(色泽=青绿)^(根蒂=硬挺)^(敲声=浊响) (5)(色泽=青绿)^(根蒂=硬挺)^(敲声=清脆) (6)(色泽=青绿)^(根蒂=硬挺)^(敲声=沉闷) (7)(色泽=青绿)^(根蒂=稍蜷)^(敲声=浊响) (8)(色泽=青绿)^(根蒂=稍蜷)^(敲声=清脆) (9)(色泽=青绿)^(根蒂=稍蜷)^(敲声=沉闷) (10)(色泽=乌黑)^(根蒂=蜷缩)^(敲声=浊响) (11)(色泽=乌黑)^(根蒂=蜷缩)^(敲声=清脆) (12)(色泽=乌黑)^(根蒂=蜷缩)^(敲声=沉闷) (13)(色泽=乌黑)^(根蒂=硬挺)^(敲声=浊响) (14)(色泽=乌黑)^(根蒂=硬挺)^(敲声=清脆) (15)(色泽=乌黑)^(根蒂=硬挺)^(敲声=沉闷) (16)(色泽=乌黑)^(根蒂=稍蜷)^(敲声=浊响) (17)(色泽=乌黑)^(根蒂=稍蜷)^(敲声=清脆) (18)(色泽=乌黑)^(根蒂=稍蜷)^(敲声=沉闷) (19)(色泽=*)^(根蒂=蜷缩)^(敲声=浊响) (20)(色泽=*)^(根蒂=蜷缩)^(敲声=清脆) (21)(色泽=*)^(根蒂=蜷缩)^(敲声=沉闷) (22)(色泽=*)^(根蒂=硬挺)^(敲声=浊响) (23)(色泽=*)^(根蒂=硬挺)^(敲声=清脆) (24)(色泽=*)^(根蒂=硬挺)^(敲声=沉闷) (25)(色泽=*)^(根蒂=稍蜷)^(敲声=浊响) (26)(色泽=*)^(根蒂=稍蜷)^(敲声=清脆) (27)(色泽=*)^(根蒂=稍蜷)^(敲声=沉闷) (28)(色泽=青绿)^(根蒂=*)^(敲声=浊响) (29)(色泽=青绿)^(根蒂=*)^(敲声=清脆) (30)(色泽=青绿)^(根蒂=*)^(敲声=沉闷) (31)(色泽=乌黑)^(根蒂=*)^(敲声=浊响) (32)(色泽=乌黑)^(根蒂=*)^(敲声=清脆) (33)(色泽=乌黑)^(根蒂=*)^(敲声=沉闷) (34)(色泽=青绿)^(根蒂=蜷缩)^(敲声=*) (35)(色泽=青绿)^(根蒂=硬挺)^(敲声=*) (36)(色泽=青绿)^(根蒂=稍蜷)^(敲声=*) (37)(色泽=乌黑)^(根蒂=蜷缩)^(敲声=*) (38)(色泽=乌黑)^(根蒂=硬挺)^(敲声=*) (39)(色泽=乌黑)^(根蒂=稍蜷)^(敲声=*) (40)(色泽=*)^(根蒂=*)^(敲声=浊响) (41)(色泽=*)^(根蒂=*)^(敲声=清脆) (42)(色泽=*)^(根蒂=*)^(敲声=沉闷) (43)(色泽=*)^(根蒂=蜷缩)^(敲声=*) (44)(色泽=*)^(根蒂=硬挺)^(敲声=*) (45)(色泽=*)^(根蒂=稍蜷)^(敲声=*) (46)(色泽=青绿)^(根蒂=*)^(敲声=*) (47)(色泽=乌黑)^(根蒂=*)^(敲声=*) (48)(色泽=*)^(根蒂=*)^(敲声=*) (49) ∅

1.4、存在的意义

在构建网络时,通常都会用到激活函数,目的是丰富假设空间。 个人感觉跟常规的分类学习算法一样,相当于增加特征。举例子来说,就好比生活中判断一个人是好人还是坏人,以前可能仅需要是否纹身(多数是某种意义上的“坏人”),但是现在可能还要结合是否抽烟、喝酒等等属性,但是否增加得越多特征越好,那当然不是,当特征增加超过一定数量,更加难判断了,假设空间太大了。

0 0

Leave a Reply

Your email address will not be published. Required fields are marked *