决策树是是分类模型常用的方法之一,其优点是容易理解、预测准确度高。除了决策树我们还可以利用logistic回归,神经网络、贝叶斯分类器、SVM等算法构建分类模型。
3)关联
关联分析是从大量数据中发现项集之间有趣的关联和相关联系。关联分析的一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助零售商制定营销策略。
在数据挖掘当中,通常用“支持度”(support)和“置性度”(confidence)两个概念来量化事物之间的关联规则。关联规则A->B的支持度support=P(AB),指的是事件A和事件B同时发生的概率。置信度confidence=P(B|A)=P(AB)/P(A),指的是发生事件A的基础上发生事件B的概率。同时满足最小支持度阈值和最小置信度阈值的规则称为强规则。比如:Computer=>antivirus_software,其中support=2%,confidence=60%,表示的意思是所有的商品交易中有2%的顾客同时买了电脑和杀毒软件,并且购买电脑的顾客中有60%也购买了杀毒软件。
关联规则在精准营销中应用
某电商公司的类目运营通过找出二级类目之间的关联性,来指导跨类目的联合促销。我们通过订单数据利用关联规则计算关联性结果如下:
根据上述的关联规则,我们在做促销活动时,可以考虑将厨房调料和纸质品、厨房调料和粮油、饼干和坚果等相关产品一起捆绑销售。