MobileNetV2: Inverted Residuals and Linear Bottlenecks
本文字数: 3.4k 阅读时长 ≈ 6 分钟
ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile
本文字数: 2.4k 阅读时长 ≈ 4 分钟
Searching for MobileNetV3
本文字数: 2.9k 阅读时长 ≈ 5 分钟
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
本文字数: 3.9k 阅读时长 ≈ 7 分钟
[OKR]2020年6月份
本文字数: 728 阅读时长 ≈ 1 分钟
5
月份实现了SSD
和Faster R-CNN
算法,同时解析了基于MaskRCNN-benchmark
的目标检测框架,另外学习了cocoapi
的使用,最后学习了YOLOv2
算法
本周继续YOLOv2
算法的实现,同时期待能够找到新工作
[YOLO][k-means聚类]寻找锚点
本文字数: 4.5k 阅读时长 ≈ 8 分钟
YOLOv2
在YOLO
的基础上进行了很多的调整,其中一个就是设置锚点框。相对于Faster R-CNN/SSD
通过人工方式设置锚点的尺度和长宽比,YOLOv2
提出了通过k-means
聚类的方式自动计算出锚点的大小
k-means聚类算法
本文字数: 3.3k 阅读时长 ≈ 6 分钟
分类 vs. 聚类
分类:类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类别的特征,再对未分类的数据进行分类。属于有监督学习(有标签) 聚类:事先不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。属于无监督学习(无标签)
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
本文字数: 4.4k 阅读时长 ≈ 8 分钟
[数据集][COCO]目标检测任务评估
本文字数: 5.7k 阅读时长 ≈ 10 分钟
Image Localization Dataset是一个目标检测数据集,其标注文件使用了PASCAL VOC
定义的格式,将其转换成COCO
格式