知识金字塔
停止更新,使用知识图谱
从2019
开始通过博客框架Hexo
以及文档框架Sphinx/MkDocs
进行文档整理,总结过去在书本以及实际编程中的知识和技能。随着文档的增多,如何有效、规范的整理越来越多的文档成了一个新的难题
偶然间看过一篇文章,里面采用金字塔的形式,按重要/难易程度分层排列不同的知识和技能。这种方式确实能够帮助理清学过的知识,同时能够更加明确未来学习的着重点。我将整个金字塔按重要/难易程度从上到下升序分为5
层:
- 工具篇
- 实现篇
- 语言篇
- 理论篇
- 基础篇
ROC
曲线(receiver operating characteristic curve
,受试者工作特征曲线)是一个二维图,用于说明分类器在不同阈值下的分类能力
本文通过ROC
曲线评价二元分类器
算法的关键环节就是评价标准的细分,通过不同的评价标准,能够理清算法实现的边界,有助于进一步思考未来进步的方向。本文专注于学习分类任务和检测任务的评价标准,关键字如下:
小结软件工程学习
之前整理了一套文档生成、托管和发布流程,使用Sphinx
完成工程文档的生成,使用Github
完成文档的托管,使用Readthedocs
完成文档的发布
在实践过程中发现整个流程都有或大或小的不足,尤其是Sphinx
工具,最近学习了另外一个文档生成工具MkDocs
,更加符合个人的需求
Iris
数据集包含3
个类别4
个属性,共150
个实例
德国信用卡数据(German Credit Data
)提供了一个二分类数据集,下载地址 - statlog/german
对于分类问题,最开始想到的评判标准就是检测准确率(accuracy
),即样本检测类别和实际一致的数量占整个样本集的比率。进一步研究发现,还可以用更精细的标准来比较检测性能,学习步骤如下:
TP/FP/TN/FN
TPR/FPR/FDR/PPV/ACC
ROC/AUC