降维算法 发表于 2019-09-12 更新于 2019-09-15 分类于 机器学习 降维算法中的”降维“,指的是降低特征矩阵中特征的数量。降维的目的是为了让算法运算更快,效果更好。对图像来说,维度就是图像中特征向量的数量。 sklearn中的降维算法sklearn中降维算法都被包括在 ... 阅读全文 »
随机森林 发表于 2019-09-08 更新于 2019-09-15 分类于 机器学习 集成算法概述集成学习是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型建模结果。基本上所有的机器学习领域都可以看到集成学习的身影。 集成算法会考 ... 阅读全文 »
数据库的数据模型 发表于 2019-09-07 更新于 2019-09-19 分类于 数据库 建立数据库系统离不开数据模型,本文介绍了常用的数据模型。重点介绍了关系数据模型的数据结构、数据操作、数据约束。 由于计算机不可能直接处理现实中的具体事物,所以人们必须事先把具体事物转换成计算机能够处理 ... 阅读全文 »
模型的评判和调优 发表于 2019-09-07 更新于 2019-10-08 分类于 机器学习 精确率和召回率 分类模型评估API:F1-score,反应了模型的稳健性 模型选择和调优交叉验证交叉验证为了让被评估的模型更加准确可信 网格搜索网格搜索是用来调参数的。通常情况下,有很多参数是需要手 ... 阅读全文 »
K-means 发表于 2019-09-07 更新于 2019-09-15 分类于 机器学习 无监督学习与聚类算法有监督学习的模型在训练的时候,即需要特征矩阵X,也需要真实标签y。机器学习当中,还有相当一部分算法属于“无监督学习”,无监督的算法在训练的时候只需要特征矩阵X,不需要标签。而聚类算 ... 阅读全文 »
逻辑回归 发表于 2019-09-07 更新于 2019-09-23 分类于 机器学习 逻辑回归推导过程逻辑回归是一种名为“回归”的线性分类器,其本质是由线性回归变化而来。想理解逻辑回归,先回顾以下线性回归。线性回归写作一个人人熟悉的方程: θ被统称为模型的参数,其中&th ... 阅读全文 »
线性回归 发表于 2019-09-07 更新于 2019-09-20 分类于 机器学习 线性回归原理回归是一种应用广泛的预测建模技术,这种技术的核心在于预测的结果是连续型变量。决策树,随机森林,支持向量机的分类器等分类算法的预测标签是分类变量,多以{0,1}来表示,而无监督学习算法比如P ... 阅读全文 »
模型的保存和加载 发表于 2019-09-07 更新于 2019-09-15 分类于 机器学习 模型的保存和加载 joblib.dump():保存模型,第一个参数是估计器,第二个参数是保存模型的目录。模型的文件格式是pkl。 joblib.load():读取模型。参数是模型的目录 阅读全文 »
决策树 发表于 2019-09-07 更新于 2020-03-03 分类于 机器学习 决策树推导首先看看下面这组数据集: 得出下面这颗决策树: 关键概念: 信息熵公式: 信息增益公式:就是熵和条件熵的差 随机变量的不确定性(熵)越小,信息增益越大, ... 阅读全文 »
朴素贝叶斯 发表于 2019-09-07 更新于 2020-02-16 分类于 机器学习 贝叶斯的性质关键概念 联合概率:X取值为x和Y取值为y两个事件同时发生的概率,表示为P(X=x,Y=y) 条件概率:在X取值为x的前提下,Y取值为y的概率。表示为P(Y=y|X=x ... 阅读全文 »