博主头像
小雨淅沥

Some things were meant to be.

总结汇报:2025/12/30

总结汇报 2025/12/30

1 第一周

详细周报链接

1.1 开题报告撰写

校内毕设事宜继续推进,撰写了任务书,以及部分开题报告的背景调查

1.2 BasicVSR++

1.2.1 Loss 函数重写

考虑到上次训练的梯度爆炸问题,这次撰写了全新的 loss 分配过程

撰写了代码,通过 cosine ramp 缓慢增加 主观指标的权重,让前期模型更多训练客观的 MSE loss

1.2.2 流程规范化

  1. 写个脚本,设定随机种子将整个训练分为 90: 5: 5 的大小,执行测试和训练
  2. 修改 Val 的逻辑,选取 5 帧进行中心裁剪,与 train 的设置大致相同,保证 val 和 train 的维度相同

1.2.3 启动训练

在 3090 单卡上执行 gt_size = 256 的一轮训练,最终迭代次数 600k

在 180k 开始逐步增加 LPIPs 的权重,在 270k 的时候权重达到峰值 0.03, 随后保持该权重

全程 lr = 1e-5 以防止过快的梯度爆炸

1.3 理论学习

学了点关于如何获得数值稳定性的方法

包括控制梯度爆炸,梯度消失的一些办法,但是感觉还是多动手才是最好的办法

2 第二周

详细周报链接

2.1 BasicVSR++

这周执行了测试的逻辑,对上周启动的训练的 模型进行了测试

测试的迭代处为 300k iter

具体过程不在这里详细赘述,展示部分统计数据

Metrics (average)LQSRDeltaDelta Percent (%)
PSNR30.212531.6961.48354.91
SSIM0.84760.87210.02452.89
LPIPs0.36380.3197-0.0440-12.12

2.2 计划

  1. 观察解码后发生了很明显的偏色,可能是由于 NVDEC 传统编码器的限制,可能可以更换为 VAE 编码器
  2. 生成的结果产生了较大的模糊,可以考虑加入 GAN 来减少模糊,增强细节
总结汇报:2025/12/30
https://www.rainerseventeen.cn/index.php/Summary-Report/52.html
本文作者 Rainer
发布时间 2025-12-30
许可协议 CC BY-NC-SA 4.0

评论已关闭