课程实验与结课报告归档

计算机视觉课程实验归档

覆盖 ResNet 图像分类、U-Net 医学图像分割、DeepPose/HRNet 姿态估计、C3D 动作识别，以及 YOLO26n 轻量目标检测结课实验。

课程归档 C:/coding/计算机视觉

Computer VisionResNetUNetHRNetC3DYOLO

归档范围

这份课程归档覆盖 C:/coding/计算机视觉 下的四个实验和一个结课报告实验。内容没有作为独立项目新增到作品集，而是作为计算机视觉课程训练链路记录在课程板块中。

实验主线

实验 1：CIFAR-10 图像分类

基于 PyTorch 训练 ResNet18，完成 CIFAR-10 数据读取、随机裁剪、水平翻转、归一化、GPU 训练、checkpoint 保存和预测可视化。最终测试集准确率为 89.590%，训练过程验证了图像分类任务中数据增强、残差网络和模型评估的基础流程。

实验 2：医学图像分割

围绕 ISBI 2012 风格的 TIFF 医学图像数据，先用 Otsu 阈值法建立传统分割对照，再实现 U-Net、Dice loss、训练与预测可视化。该实验重点展示像素级预测、skip connection 和前景重叠度评估在分割任务中的作用。

实验 3：人体姿态估计

实验分为 DeepPose 坐标回归、HRNet heatmap 前向传播、关键点解码与骨架可视化三层。DeepPose 用 ResNet50 backbone 直接回归 17 个关键点坐标，HRNet 输出关键点热力图，再通过 get_max_preds 和 get_avg_preds 解码为空间坐标。

实验 4：UCF101 动作识别

复现 C3D 的三维卷积结构，验证视频张量 [batch, channel, frame, height, width] 的前向传播，并在 UCF101 上完成 GPU 冒烟训练、128 样本小规模训练闭环、checkpoint 保存、验证集评估和 loss 曲线绘制。该实验把单帧视觉扩展到视频时空特征建模。

结课报告实验：轻量目标检测

结课报告选择 YOLO26n 作为小于 10 MB 约束下的目标检测模型，围绕模型大小、参数量、mAP50、训练分辨率、小目标漏检和 class 2 crop 增强进行多轮实验。最终形成了从模型选择、约束解释、训练诊断到失败样本分析的完整检测实验记录。

展示价值

这组材料展示的是计算机视觉基础能力的横向覆盖：分类、分割、关键点、视频理解和目标检测。更重要的是，它把课程实验从“跑通代码”推进到“能解释模型选择、数据瓶颈和评估限制”的工程复盘层次。