01 Mar 2018

Machine Learning

随机森林:利用多棵树对样本进行训练并预测的一种分类器。

KNN

  • k近邻算法是一种基本分类和回归方法
  • 少数服从多数
  • k值太小,模型过于复杂,容易过拟合
  • k值太大,模型过于简单

数据操作:

  • 特征归一化:保证每个特征同等重要性
\[y = log(1 + e^{x})\]