大海

[二分类]ROC曲线

发表于 2019-12-23 更新于 2026-02-07 分类于算法与模型，经典机器学习方法本文字数： 1.7k 阅读时长 ≈ 6 分钟

ROC曲线（receiver operating characteristic curve，受试者工作特征曲线）是一个二维图，用于说明分类器在不同阈值下的分类能力

本文通过ROC曲线评价二元分类器

阅读全文 »

发表于 2019-12-23 更新于 2026-02-07 分类于算法与模型，计算机视觉技术，经典机器学习方法本文字数： 130 阅读时长 ≈ 1 分钟

算法的关键环节就是评价标准的细分，通过不同的评价标准，能够理清算法实现的边界，有助于进一步思考未来进步的方向。本文专注于学习分类任务和检测任务的评价标准，关键字如下：

发表于 2019-12-23 更新于 2026-02-07 分类于算法与模型，经典机器学习方法本文字数： 547 阅读时长 ≈ 2 分钟

混淆矩阵（confusion matrix）是分类任务中最常见的特性，通过矩阵形式展示预测类别和真实类别的差异

本文学习二分类下的混淆矩阵

阅读全文 »

发表于 2019-12-20 更新于 2026-02-07 分类于软件工程，高质量编码实践，测试与可靠性，系统架构设计本文字数： 71 阅读时长 ≈ 1 分钟

小结软件工程学习

发表于 2019-12-20 更新于 2026-02-07 本文字数： 78 阅读时长 ≈ 1 分钟

小结数学学习过程中总结的文档

发表于 2019-12-18 更新于 2026-02-07 分类于工具与效率，软件工程，开发者工具（CLI/IDE/调试），高质量编码实践本文字数： 298 阅读时长 ≈ 1 分钟

之前整理了一套文档生成、托管和发布流程，使用Sphinx完成工程文档的生成，使用Github完成文档的托管，使用Readthedocs完成文档的发布

在实践过程中发现整个流程都有或大或小的不足，尤其是Sphinx工具，最近学习了另外一个文档生成工具MkDocs，更加符合个人的需求

发表于 2019-12-14 更新于 2026-02-07 分类于算法与模型，经典机器学习方法本文字数： 552 阅读时长 ≈ 2 分钟

Iris数据集包含3个类别4个属性，共150个实例

发表于 2019-12-13 更新于 2026-02-07 分类于算法与模型，经典机器学习方法本文字数： 364 阅读时长 ≈ 1 分钟

德国信用卡数据（German Credit Data）提供了一个二分类数据集，下载地址 - statlog/german

发表于 2019-12-13 更新于 2026-02-07 分类于算法与模型，经典机器学习方法本文字数： 1.7k 阅读时长 ≈ 6 分钟

对于分类问题，最开始想到的评判标准就是检测准确率（accuracy），即样本检测类别和实际一致的数量占整个样本集的比率。进一步研究发现，还可以用更精细的标准来比较检测性能，学习步骤如下：

发表于 2019-12-11 更新于 2026-02-07 分类于算法与模型，模型训练与优化，工具与效率，开发者工具（CLI/IDE/调试）本文字数： 1.3k 阅读时长 ≈ 5 分钟

学习了PyTorch环境下的Tensorboard使用 - [PyTorch]Tensorboard可视化实现。PyTorch也提供了Tensorboard学习教程 - Visualizing Models, Data, and Training with TensorBoard

下面结合一个完整的训练过程，通过Tensorboard实现可视化