HI,下午好,欢迎来到微信公众号转让!
公众号转让,微信公众号交易平台,公众号出售购买卖价格 24小时服务热线: 4000-163-301

新闻动态

NEWS CENTER

支持度揭示了同时未掌握知识点1与知识点2的学生在整个数据集的占比

2019-06-30

支持度、置信度和提升度

支持度揭示了同时未掌握知识点1与知识点2的学生在整个数据集的占比,针对上方案例支持度 Support = 4000/10000 = 40%。

支持度越小,说明同时未掌握知识点1和知识点2的学生少之又少,两个知识点之间的联系并不大;若支持度很大,则说明未掌握知识点1与知识点2的学生占比非常大,那两个知识点的相关性可能已经成为常识了,并不值得深究。

那仅了解支持度就足够了么?肯定不是,通过支持度我们仅能了解到学生同时未掌握知识点1与知识点2的频率,但我们并不能得到未掌握知识点1对未掌握知识点2起了多少决定因素。因此,我们要引入第二个指标,就是置信度。

置信度揭示了在未掌握知识点1的学生人群中,同时有多少学生也未掌握知识点2。针对上方案例,置信度 confidence = 4000/6000 = 67%。也就是意味着,在未掌握知识点1的学生中有67%的学生也未掌握知识点2。

是不是看了以上两个指标后,你会觉得知识点1与知识点2肯定存在着某种频繁关系?

毕竟67%已经不算是一个小数字了。但是我们再回看下案例,如果我们不考虑知识点1的掌握情况,只看知识点2的未掌握学生占比,这个值会高达 80% !这就表明未掌握知识点1对未掌握知识点2并不是一个正向的关系,未掌握知识点1的可能性提升反而会导致未掌握知识点2的可能性下降。

是不是很反常理?我额外掌握了一个知识点居然会让我遗忘另一个知识点。其实,从现象上讲这也是可能的。因为,人的大脑容量有限,并且部分知识点会存在干扰项,你学得多就会导致做题的时候会多种思考的维度,这可能会让学生误入歧途。(时隔多年,我终于找到我考试考不好的原因了!)。为了解决这个问题,我们引入了提升度。

  • 当提升度为1时说明,应用关联规则和不应用关联规则产生相同的结果;
  • 当提升度大于1时,说明应用关联规则和不应用关联规则能产生更好的结果;
  • 当提升度小于1时,关联规则具有负相关的作用。

本例中的提升度 Lift = 67 % / 80% = 0.84,所以知识点1与知识点2是负相关的。

实际应用

解释完以上内容后,相信大家已经对关联分析规则有了一个大致的概念。接下来我们进行实操,针对所有知识点进行两两组合,分别统计在未掌握知识点1的情况下未掌握知识点2的学生出现的数量、支持度、置信度和提升度。