大海

[二分类]ROC曲线

发表于 2019-12-23 更新于 2022-01-16 分类于评估指标/evaluation metrics

本文字数： 5.9k 阅读时长 ≈ 11 分钟

ROC曲线（receiver operating characteristic curve，受试者工作特征曲线）是一个二维图，用于说明分类器在不同阈值下的分类能力

本文通过ROC曲线评价二元分类器

阅读全文 »

[分类][检测]评价标准

发表于 2019-12-23 更新于 2021-03-30 分类于评估指标/evaluation metrics

本文字数： 159 阅读时长 ≈ 1 分钟

算法的关键环节就是评价标准的细分，通过不同的评价标准，能够理清算法实现的边界，有助于进一步思考未来进步的方向。本文专注于学习分类任务和检测任务的评价标准，关键字如下：

阅读全文 »

[二分类]混淆矩阵

发表于 2019-12-23 更新于 2022-01-13 分类于评估指标/evaluation metrics

本文字数： 1.1k 阅读时长 ≈ 2 分钟

混淆矩阵（confusion matrix）是分类任务中最常见的特性，通过矩阵形式展示预测类别和真实类别的差异

本文学习二分类下的混淆矩阵

阅读全文 »

软件工程小结

发表于 2019-12-20 更新于 2021-04-04 分类于软件工程/software engineering

本文字数： 72 阅读时长 ≈ 1 分钟

小结软件工程学习

阅读全文 »

数学

发表于 2019-12-20 更新于 2021-03-30 分类于数学/math

本文字数： 92 阅读时长 ≈ 1 分钟

小结数学学习过程中总结的文档

阅读全文 »

MkDocs vs Sphinx

发表于 2019-12-18 更新于 2021-04-06 分类于部署/deploy

本文字数： 451 阅读时长 ≈ 1 分钟

之前整理了一套文档生成、托管和发布流程，使用Sphinx完成工程文档的生成，使用Github完成文档的托管，使用Readthedocs完成文档的发布

在实践过程中发现整个流程都有或大或小的不足，尤其是Sphinx工具，最近学习了另外一个文档生成工具MkDocs，更加符合个人的需求

阅读全文 »

[数据集]Iris

发表于 2019-12-14 更新于 2021-04-03 分类于数据集/dataset

本文字数： 3k 阅读时长 ≈ 5 分钟

Iris数据集包含3个类别4个属性，共150个实例

阅读全文 »

[数据集]German Credit Data

发表于 2019-12-13 更新于 2021-04-03 分类于数据集/dataset

本文字数： 1.5k 阅读时长 ≈ 3 分钟

德国信用卡数据（German Credit Data）提供了一个二分类数据集，下载地址 - statlog/german

阅读全文 »

[ROC][AUC]二分类任务评判标准

发表于 2019-12-13 更新于 2022-01-16 分类于评估指标/evaluation metrics

本文字数： 3.8k 阅读时长 ≈ 7 分钟

对于分类问题，最开始想到的评判标准就是检测准确率（accuracy），即样本检测类别和实际一致的数量占整个样本集的比率。进一步研究发现，还可以用更精细的标准来比较检测性能，学习步骤如下：

正样本和负样本
TP/FP/TN/FN
TPR/FPR/FDR/PPV/ACC
ROC/AUC

阅读全文 »

[PyTorch]Tensorboard使用实践

发表于 2019-12-11 更新于 2021-04-14 分类于深度学习/deeplearning

本文字数： 7.8k 阅读时长 ≈ 14 分钟

学习了PyTorch环境下的Tensorboard使用 - [PyTorch]Tensorboard可视化实现。PyTorch也提供了Tensorboard学习教程 - Visualizing Models, Data, and Training with TensorBoard

下面结合一个完整的训练过程，通过Tensorboard实现可视化

阅读全文 »