2022-10-16 科研流水账21 科研流水账21 阅读了论文 Person re-identification with part prediction alignment论文提出的方法:考虑融合局部和全局特征的优点,使得提取的特征更具有辨别性。作者提出了使用teacher-student网络来提取global-local特征。设计了局部预测对齐(Part Prediction Alignment)网络来提取局部特征。应用了 teacher-student 网络使得全局特征提取指导局部特征提取,使得提取的特征不仅包含全局的空间信息,也包含人体局部结构之间的线索。代码修改:在fast-reid 中加入了多头注意力机制并做了部分相关实验。尝试修改ID loss为 CrossEntropyLabelSmooth,Metric loss 修改为supcon loss。问题分析修改之后 supcon loss 算出来结果为 nan。经过不断调试对比,发现传入 supcon loss 进行计算的特征数值有问题。目前定位到可能是最后一层 batchNorm1d 时出了问题。下一步修改pvasf, 添加 FPA 模块。思考总结 HRCN 三点修... 2022-10-16 2022年10月16日 0 阅读 0 评论
2022-10-09 科研流水账20 科研流水账20 阅读了较好的论文 Seeing Like a Human: Asynchronous Learning With Dynamic Progressive Refifinement for Person Re-Identifification论文设计了一个考虑时间和空间异步学习的结构,使特征更具有分辨性。提出了一个动态的渐进式提炼模块,用高维特征指导低维特征。下载了京东开源的行人重识别框架代码,只使用 ResNet 在 VeRi数据集上进行重识别任务。根据两篇论文调整学习率和batch_size .尝试把多头注意力加到只是用 ResNet 的车辆重识别模型上,代码没有调通。 2022-10-09 2022年10月09日 0 阅读 0 评论
2022-10-02 科研流水账19 科研流水账19 阅读了论文 V2I-CARLA: A novel dataset and a method for vehicle re-Identification based V2I environment提出了一种特征金字塔注意力模块来获得多尺度的特征。使用了 circle loss 提高车辆重识别的效果。将多尺度多分支的网络结构中的逆注意力模块调小或去掉进行实验.将三重注意力机制加到hrcn上.将自注意力模块加到pvas上.加自注意力模块后效果降了很多,感觉可能是代码写的有问题下步研究计划参考 A Strong Baseline for Vehicle Re-Identification 论文中多头注意力实现的方法进一步修改调试.参考特征金字塔FPA 的网络结构去探索对多尺度特征利用的修改方法. 2022-10-02 2022年10月02日 0 阅读 0 评论
2022-09-25 科研流水账18 科研流水账18 阅读了论文 RMSBA: Multiple Scales, Branches and Attention Network With Bag of Tricks for Person Re-Identification论文提出了一种多尺度,多分支的行人重识别网络模型,并且在每个阶段之间使用了SE注意力模块。将多尺度多分支行人识别的网络结构添加到车辆重识别上。loss 收敛到4 左右就趋于稳定了。与之前最好效果的训练日志对比,mAP 在开始时效果还行,越往后就效果比不上。下一步实验时并未将行人识别中使用的 resnet50-ibn预训练模型替换车辆识别项目中。实验时并未用最新的 triplet-attentions 替换 SE 模块。下一步将进行相应修改,去调整项目代码,进一步进行实验。 2022-09-25 2022年09月25日 0 阅读 0 评论
2022-09-18 科研流水账17 科研流水账17 阅读了论文 Rotate to Attend: Convolutional Triplet Attention Module改论文提出了一种三重注意力模块,主要通过三个分支实现。第一个分支通过 channel 的维度C和宽度W计算注意力权重。第二个分支通过 channel的维度和高度H计算注意力权重。最后一个分支主要依赖空间维度的W和H。前两个分支应用旋转操作在channel维度和H或W间建立链接。运行triplet-attention 代码,然后将 tirplet-attention 加在骨干网络出来的特征图后面。问题分析triplet-attention 代码的数据集处理脚本是在 Ubuntu 上运行的,修改部分 shell 代码,使其可以在 windows 的git bash 上运行。代码没有将张量放到 cuda 上运行,修改错误代码。代码没有声明使用 TripletAttention,修改代码。下一步计划已经在服务器运行了修改后的代码,先看看效果叭。 2022-09-18 2022年09月18日 0 阅读 0 评论
2022-09-11 科研流水账16 科研流水账16 阅读了论文 Viewpoint robust knowledge distillation for accelerating vehicle re-identification论文提出的方法:通过知识蒸馏,在保持特征的视角信息鲁棒性的情况下加速车辆重识别。设计了由四种不同方向的池化组成的四重深度网络作为老师网络,学生网络由骨干子网络和全局平均池化组成,最后学生网络通过最小化两者间后验概率分布的KullbackLeibler 发散蒸馏具有鲁棒性的视角知识。下载了车路协同的数据集,将车路协同的代码在 windows 上运行。导师发布了新的研究任务😬👁️,现在让我去整车路协同最终弄出来感觉还是挺酷的!🐮👃问题分析首先是编译 Bbx IOU cuda version 遇到的一系列问题。运行 python opencood/utils/setup.py build_ext --inplace 会报错找不到 vsvarsall.bat。然后下载 visual studio及 msvc 编译生产工具报错 fatal error C1083: Cannot open include file: ... 2022-09-11 2022年09月11日 0 阅读 0 评论
2022-09-04 科研流水账15 科研流水账15 阅读了论文 Exploring Spatial Significance via Hybrid PyramidalGraph Network for Vehicle Re-identification这篇论文介绍了一种新的方法,通过设计空间图网络(SGN)来探索特征图的空间含义。作者还进一步设计了一个金字塔图网络(PGN),这是由多个SGN构成的,用来探索在不同尺度下特征图的空间含义。这种方法旨在更深层次地理解和利用特征图的空间信息,从而提高模型处理图像或其他空间数据的能力。调试理解异质关系补充网络(HRCN)的代码,将通过图关系跨层级补充的代码放到 PAVSSF 的全局特征部分。将 HRCN 代码放到服务器上运行。问题分析关于代码修改的工作,目前需要将HRCN里面很多代码直接调用函数在PAVSFF上实现。在服务器上运行 HRCN 代码时遇到 conda 报错。一开始时运行 onda install pytorch==1.4.0 torchvision==0.5.0 cudatookit=10.1 -c pytorch 报错 conda http error http 000 ... 2022-09-04 2022年09月04日 0 阅读 0 评论
2022-08-29 科研流水账14 科研流水账14 阅读了论文 Relation Network for Person Re-identification论文提出了一种考虑单个身体部分与剩余身体部分之间关系的行人重识别网络。引入了全局相对池化(GCP)获得全局特征。在深入研究训练迭代过程中,我仔细调试并理解了如何通过采样器来选取和读取数据,并将其最终转换为张量(tensor),然后根据每个批次(batch)的规定数量输出数据的完整流程。此外,我单独运行并调试了model.py文件,通过在该文件下添加实例化模型以及使用相关代码的操作,成功实现了模型的调试。在此过程中,我清晰地理解了组件特征和总体特征提取的过程,尽管我跳过了全局平均池化(Global Average Pooling)代码细节的深入理解。这一系列操作加深了我对模型训练过程中数据处理和特征提取机制的认识。问题分析直接调试时卡顿,没步调试会停顿几十秒左右,有时候加载不出来数据。当调试到图片的张量时就会开始出现这个问题。问了张师兄,发现他没有类似问题,说明是我的电脑硬件问题。感觉可能是显存太小。直接调试 models.py文件自定义代码时,遇到不能使用相对路径的问题,自定义的... 2022-08-29 2022年08月29日 0 阅读 0 评论
2022-08-21 科研流水账13 科研流水账13 阅读了论文 VOC-ReID: Vehicle Re-identification based on Vehicle-Orientation-Camera论文提出融合车辆本身、拍摄角度、拍摄相机三种信息来解决摄像头拍摄图片中,车辆外形因为不同角度和光照相似的问题。去看了 hrcn 项目检测头的代码,还看了 RRID 项目的代码。(Relation Network for Person Re-identification)论文RRID 里的 One-vs.-rest 关系模块基本上已经结合代码弄懂,但是后续对于这个关系模块产生的特征的处理还需要调试去弄清步骤。 下一步调试代码弄清RRID 中对最终局部关系特征的处理代码,并与 PVASFF 中类似部分的具体实现进行对比,弄清这部分的输入和输出,然后把RRID 的代码应用在 PVASFF 上。 2022-08-21 2022年08月21日 0 阅读 0 评论
2022-08-14 科研流水账12 科研流水账12 阅读了论文 Heterogeneous Relational Complement for Vehicle Re-identification在研究中,提升车辆重识别性能的一个重要方向是利用区分度高的区域特征来补充总体特征。传统方法,如关键点定位、边界框、语义分割等,虽然有效,但都依赖于对数据的额外标注,这不仅增加了工作量,也限制了它们的应用范围。针对这一问题,论文提出了一种新颖的无需标注的方法,旨在构建具有鲁棒性的补充特征,以进一步提高车辆重识别的准确性。该论文首先介绍了两种类型的特征补充方法:跨区域补充和跨层级补充。这两种方法分别关注于不同方面的特征增强,旨在全面提升重识别模型的性能。随后,论文详细阐述了如何利用图关系模块(graph-based relation modules)来处理这些补充特征。通过这种方式,各种补充特征被有效地嵌入到同一个高维空间中,从而实现了特征之间的有效融合和互补,提高了重识别系统的整体表现。这种无需额外标注的方法,不仅降低了实施难度,还提高了模型的通用性和实用性。这周帮导师建立了实验室博客🥳 。 还挺有意思🤯请输入链接描述 2022-08-14 2022年08月14日 0 阅读 0 评论