一、Boosting算法

Boosting集成分类器包含多个非常简单的成员分类器，这些成员分类器的性能仅好于随机猜想，常被称为弱学习机。典型的弱学习机的例子就是单层决策树。Boosting算法主要针对难以区分的样本，弱学习机通过在分类错误的样本上进行学习来提高继承分类器的分类性能。Boosting与Bagging不同，在Boosting的初始化阶段采用的是无返回抽样从训练样本中随机抽取一个子集，而Bagging采用的是有放回的抽取。Boosting的过程由四个步骤组成：

1、从训练集D中以无放回抽样方式随机抽取一个训练子集d1，用于弱学习机C1的训练。

2、从训练集D中以无放回抽样方式随机抽取一个训练子集d2，并将C1中误误分类样本的50%加入到训练集中，训练得到弱学习机C2。

3、从训练集D中抽取C1和C2分类结果不一致的训练样本生成训练样本集d3，用d3来训练第三个弱学习机C3。

4、通过多数投票来组合弱学习机C1、C2和C3。

Boosting与Bagging模型相比，Boosting可以同时降低偏差也方差，Bagging只能降低模型的方差。在实际应用中，Boosting算法也还是存在明显的高方差问题，也就是过拟合。

二、AdaBoost算法

AdaBoost算法与Boosting算法不同，它是使用整个训练集来训练弱学习机，其中训练样本在每次迭代的过程中都会重新被赋予一个权重，在上一个弱学习机错误的基础上进行学习来构建一个更加强大的分类器。下面通过一个图来了解AdaBoost算法的工作过程

训练样本由两个不同的种类(蓝球和红球)所组成。在第一幅图中所有的样本都被赋予了相同的权重，通过训练集的训练，我们可以获取到一个单层的决策树(代表图中的虚线)，它通过最小化代价函数(样本不纯度)来划分两类不同的样本，其中有两个篮球和一个红球被错误的划分。在第二次训练的过程中，两被错误划分个篮球和一个被错误划分的红色被赋予更大的权重(球变得更大)，同时还可以降低正确划分样本的权重，在本次训练的过程中更加专注于权重大的样本，也就是划分错误的样本。通过重复这个过程，最后直至样本划分正确。然后，得到一个弱学习机的组合，通过多数投票的方式来决定最后的预测结果。

AdaBoost算法的步骤如下：

1、以相同的初始值来初始化样本的权重ω，并且样本权重之和为1。