TypechoJoeTheme

鱼一的博客 ◡̈

yuyi

知不可乎骤得,托遗响于悲风
网站页面
标签搜索

最新文章

2022-08-29

科研流水账14

科研流水账14
阅读了论文 Relation Network for Person Re-identification论文提出了一种考虑单个身体部分与剩余身体部分之间关系的行人重识别网络。引入了全局相对池化(GCP)获得全局特征。在深入研究训练迭代过程中,我仔细调试并理解了如何通过采样器来选取和读取数据,并将其最终转换为张量(tensor),然后根据每个批次(batch)的规定数量输出数据的完整流程。此外,我单独运行并调试了model.py文件,通过在该文件下添加实例化模型以及使用相关代码的操作,成功实现了模型的调试。在此过程中,我清晰地理解了组件特征和总体特征提取的过程,尽管我跳过了全局平均池化(Global Average Pooling)代码细节的深入理解。这一系列操作加深了我对模型训练过程中数据处理和特征提取机制的认识。问题分析直接调试时卡顿,没步调试会停顿几十秒左右,有时候加载不出来数据。当调试到图片的张量时就会开始出现这个问题。问了张师兄,发现他没有类似问题,说明是我的电脑硬件问题。感觉可能是显存太小。直接调试 models.py文件自定义代码时,遇到不能使用相对路径的问题,自定义的...
2022-08-29
2022年08月29日
0 阅读
1 评论
2022-08-21

科研流水账13

科研流水账13
阅读了论文 VOC-ReID: Vehicle Re-identification based on Vehicle-Orientation-Camera论文提出融合车辆本身、拍摄角度、拍摄相机三种信息来解决摄像头拍摄图片中,车辆外形因为不同角度和光照相似的问题。去看了 hrcn 项目检测头的代码,还看了 RRID 项目的代码。(Relation Network for Person Re-identification)论文RRID 里的 One-vs.-rest 关系模块基本上已经结合代码弄懂,但是后续对于这个关系模块产生的特征的处理还需要调试去弄清步骤。 下一步调试代码弄清RRID 中对最终局部关系特征的处理代码,并与 PVASFF 中类似部分的具体实现进行对比,弄清这部分的输入和输出,然后把RRID 的代码应用在 PVASFF 上。
2022-08-21
2022年08月21日
0 阅读
0 评论
2022-08-14

科研流水账12

科研流水账12
阅读了论文 Heterogeneous Relational Complement for Vehicle Re-identification在研究中,提升车辆重识别性能的一个重要方向是利用区分度高的区域特征来补充总体特征。传统方法,如关键点定位、边界框、语义分割等,虽然有效,但都依赖于对数据的额外标注,这不仅增加了工作量,也限制了它们的应用范围。针对这一问题,论文提出了一种新颖的无需标注的方法,旨在构建具有鲁棒性的补充特征,以进一步提高车辆重识别的准确性。该论文首先介绍了两种类型的特征补充方法:跨区域补充和跨层级补充。这两种方法分别关注于不同方面的特征增强,旨在全面提升重识别模型的性能。随后,论文详细阐述了如何利用图关系模块(graph-based relation modules)来处理这些补充特征。通过这种方式,各种补充特征被有效地嵌入到同一个高维空间中,从而实现了特征之间的有效融合和互补,提高了重识别系统的整体表现。这种无需额外标注的方法,不仅降低了实施难度,还提高了模型的通用性和实用性。这周帮导师建立了实验室博客🥳 。 还挺有意思🤯请输入链接描述
2022-08-14
2022年08月14日
0 阅读
1 评论
2022-08-14

pytorch 踩坑记录

pytorch 踩坑记录
我在使用 pytorch 过程中遇到的问题记录自己使用 pytorch 进行深度学习过程中遇到的一些问题和解决办法 ㊙ 这些解决方法未必是最佳方案1️⃣使用 DataParallel 时,GPU 显存负载不均衡使用单机多显卡时,可能每张显卡的显存大小不是一致的。而 DataParallel 默认是根据显卡的数量对 batchsize 进行均分,每张显卡都会被分配到一样大小的显存消耗。修改 torch > nn > Parallel > scatter_gather.py 的 scatter_map 函数如下 def scatter_map(obj): if isinstance(obj, torch.Tensor): # 获得 batchsize 的数量 batch_size = obj.shape[0] # 将 2/3 的 batchsize 传入第一个 gpu, 剩下的分给第二个 num1 = 2*batch_size//3 return...
2022-08-14
2022年08月14日
0 阅读
0 评论
2022-08-07

科研学习流水账11

科研学习流水账11
阅读了论文 AttributeNet: Attribute enhanced vehicle re-identification该论文探索属性线索在车辆重识别上的提升。提出了一种新的结构Anet,增强了属性监督模块和车辆重识别间的交互,以此驱动提取的属性更好的为重识别服务。引入了一种改进的约束,使得结合属性后的重识别特征更具有鉴别性。阅读了论文 Lord of the Rings: Hanoi Pooling and Self-Knowledge Distillation for Fast and Accurate Vehicle Re-Identification论文提出了一种不需要额外标记和低计算量开销的方法来学习特征。引入了汉诺塔池化层提取环形区域(ring regions),使用图像金字塔的方法生成车辆的多尺度特征。通过自知识蒸馏框架来实现将深层网络的准确性转移到第一层(accuracyof a deep network to its first layers),从而停止早期测试实例来减少推理的工作量。
2022-08-07
2022年08月07日
0 阅读
1 评论
2022-08-01

科研学习流水账10

科研学习流水账10
阅读了论文 Counterfactual Attention Learning for Fine-Grained Visual Categorization and Reidentificatio论文提出一种反事实(counterfactual)的注意力学习方法,学习具有反事实因果关系的注意力。从而可以更有效率的进行注意力学习。通过反事实干预,分析学习到的视觉注意对网络预测的影响,并最大限度地提高影响使网络去学习更多有用的注意。在服务器上运行了 PVEN 的项目代码。在本地调试代码的过程中,在加载网络结构后继续调试的过程中经常遇到调试工具卡顿的情况。有的时候等一阵子就可以继续调试了,有的时候需要中断调试过程再来一遍,十分影响看代码的效率和心情。可能是本地笔记本显卡比较差的原因😩
2022-08-01
2022年08月01日
0 阅读
1 评论
2022-07-24

科研学习流水账9

科研学习流水账9
阅读了论文 A Strong Baseline for Vehicle Re-Identification阅读了论文 pven 和其开源的代码。导师嫌我一个多月没什么实质性进展,换方向了🤪。该论文通过下面三点来提升模型性能:① 减少真实数据和合成数据之间的领域差距② 通过堆叠多头与注意力机制修改网络③ 自适应损失权重调整调试 PVEN 车辆重识别的代码,理清了代码结构。明天继续结合论文搞清楚代码的每个重要的部分,了解最新论文中的一些方法是否能借鉴。
2022-07-24
2022年07月24日
0 阅读
2 评论
2022-07-17

科研学习流水账8

科研学习流水账8
阅读了论文 Spatial Attention Fusion for Obstacle Detection UsingMmWave Radar and Vision Sensor导师帮我找了一些多模态目标检测的论文,说是会比纯视觉方向好出论文。下载并尝试运行 SAF-FCOS 的代码,解决了环境问题,但是最后由于没有模型,无法跑通测试程序。训练程序由于机器限制,以及考虑到 nuScenes 上百G的训练集大小,暂时没跑。进一步调试 centerFusion 的代码,理解输入的图片和雷达信息问题分析关于图片预处理部分,看懂了代码在做什么,但是还没弄清具体意义。首选改变图片尺寸,接着求出仿射变换矩阵,然后对输入尺寸比上下采样率,得到输出尺寸,再对输出尺寸求出仿射变换矩阵,最后对图片进行仿射变换并改变尺寸。解决的办法:先看继续理解后面代码,看看有没有和这部分处理相关联的地方。
2022-07-17
2022年07月17日
0 阅读
0 评论
2022-07-10

科研学习流水账7

科研学习流水账7
阅读了论文 RADAR+RGB FUSION FOR ROBUST OBJECT DETECTION IN AUTONOMOUS VEHICLE调试并弄懂了 CenterFusion 数据集加载部分以及模型加载流程。问题分析模型部分使用CenterNet来预测物体的中心点和尺寸。难点包括 key point关键点损失函数,offset 损失函数,尺寸损失函数,整体损失函数等。下一步研究计划看了一些代码和论文了,下一步打算从中挑一个较新的方法细扣代码。精一而悟道。
2022-07-10
2022年07月10日
0 阅读
1 评论
2022-07-03

科研学习流水账6

科研学习流水账6
阅读论文 CenterFusion: Center-based Radar and Camera Fusion for 3D Object Detection Ramin1、将 CenterFusion 运行并把结果图片使用 opencv 转换为视频。2、使用 yolov5 对学校对面十字路口交通状况视频进行检测。3、正在对 CenterFusion 项目检测代码文件进行 debug,结合论文理解。问题分析在多种感知模态融合时,过早对多种模态的感知数据进行融合,通常会使得最后结果受数据的空间和时间影响较大,而过晚融合虽然可以在引入新模态时拥有更多灵活性,但它不能全面的利用到各感知模态的潜力。因此,CenterFusion 提出了“中层融合”的方法。明天干嘛继续debug 代码,并结合论文相关内容学习。
2022-07-03
2022年07月03日
0 阅读
1 评论
yuyi
知不可乎骤得,托遗响于悲风
128 文章数
17,471 评论量

More Info for me 📱

IP信息

人生倒计时

今日已经过去小时
这周已经过去
本月已经过去
今年已经过去个月