数学
小结数学学习过程中总结的文档
之前整理了一套文档生成、托管和发布流程,使用Sphinx完成工程文档的生成,使用Github完成文档的托管,使用Readthedocs完成文档的发布
在实践过程中发现整个流程都有或大或小的不足,尤其是Sphinx工具,最近学习了另外一个文档生成工具MkDocs,更加符合个人的需求
Iris数据集包含3个类别4个属性,共150个实例
德国信用卡数据(German Credit Data)提供了一个二分类数据集,下载地址 - statlog/german
对于分类问题,最开始想到的评判标准就是检测准确率(accuracy),即样本检测类别和实际一致的数量占整个样本集的比率。进一步研究发现,还可以用更精细的标准来比较检测性能,学习步骤如下:
TP/FP/TN/FNTPR/FPR/FDR/PPV/ACCROC/AUC学习了PyTorch环境下的Tensorboard使用 - [PyTorch]Tensorboard可视化实现。PyTorch也提供了Tensorboard学习教程 - Visualizing Models, Data, and Training with TensorBoard
下面结合一个完整的训练过程,通过Tensorboard实现可视化
最新版本的PyTorch 1.3内置支持了Tensorboard,实现模型、数据以及训练可视化
PyTorch通过TorchVision工具包提供统一的数据加载、数据处理的接口,允许自定义类的方式加载数据集,通过DataLoader接口来批量处理
相关实现:zjykzj/vocdev
PASCAL VOC 2007数据集基于4个大类别,共包含了20个目标类:
Person: personAnimal: bird, cat, cow(奶牛), dog, horse, sheep(绵羊)Vehicle(交通工具): aeroplane(飞机), bicycle, boat(小船), bus(公共汽车), car(轿车), motorbike(摩托车), train(火车)Indoor(室内): bottle(瓶子), chair(椅子), dining table(餐桌), potted plant(盆栽植物), sofa, tv/monitor(电视/显示器)PASCAL VOC 2007数据集主要用于分类/测试任务,同时也提供了分割和人体部件检测的数据。示例如下: