[二分类]混淆矩阵
混淆矩阵(confusion matrix
)是分类任务中最常见的特性,通过矩阵形式展示预测类别和真实类别的差异
本文学习二分类下的混淆矩阵
小结软件工程学习
之前整理了一套文档生成、托管和发布流程,使用Sphinx
完成工程文档的生成,使用Github
完成文档的托管,使用Readthedocs
完成文档的发布
在实践过程中发现整个流程都有或大或小的不足,尤其是Sphinx
工具,最近学习了另外一个文档生成工具MkDocs
,更加符合个人的需求
Iris
数据集包含3
个类别4
个属性,共150
个实例
德国信用卡数据(German Credit Data
)提供了一个二分类数据集,下载地址 - statlog/german
对于分类问题,最开始想到的评判标准就是检测准确率(accuracy
),即样本检测类别和实际一致的数量占整个样本集的比率。进一步研究发现,还可以用更精细的标准来比较检测性能,学习步骤如下:
TP/FP/TN/FN
TPR/FPR/FDR/PPV/ACC
ROC/AUC
学习了PyTorch
环境下的Tensorboard
使用 - [PyTorch]Tensorboard可视化实现。PyTorch
也提供了Tensorboard
学习教程 - Visualizing Models, Data, and Training with TensorBoard
下面结合一个完整的训练过程,通过Tensorboard
实现可视化
最新版本的PyTorch 1.3
内置支持了Tensorboard,实现模型、数据以及训练可视化
之前识别测试最常用的是手写数字数据集MNIST,今天遇到一个新的基准数据集 - Fashion-MNIST