整理网站发布过的论文调研,涉及模型训练、目标分类、目标检测、图像检索、OCR、人脸检测/识别、模型蒸馏、模型剪枝、视频识别、细粒度分类、行人属性识别、视频压缩等领域。

阅读全文 »

NVIDIA Triton 是一款由 NVIDIA 开发的高性能推理服务软件,不仅能够支持多种主流的推理框架,如 PyTorch、ONNX Runtime 和 TensorRT 等,还具备强大的多GPU负载均衡能力,确保高效利用计算资源。NVIDIA Triton 通过提供统一的接口来管理不同框架下的模型,能够大大提高模型部署的灵活性与效率。

阅读全文 »