主题一:扩散模型在图像拼接中的研究
主讲:罗永曦
(导师:王杰)
主题二:宽动态范围激光雷达测距系统研究
主讲:廖一镓
(导师:魏巍)
主题三:基于邻层引导的场景文本检测方法
主讲:谭敏聪
(导师:彭绍湖)
主办机构
广州大学电子与通信工程学院
时间安排
2024年5月27日14:30-15:45
地点
b4 – 213
为拓宽研究生学术视野,促进研究生学术交流,营造良好的学术氛围,广州大学电子与通信工程学院主办的“研途青年说”第71讲于5月27日14:30-15:45在b4-213举行。本次主讲人为21级研究生罗永曦 、廖一镓和谭敏聪。
罗永曦同学汇报的主题是扩散模型在图像拼接中的研究,他的讲解主要包括以下六部分:选题背景及意义、现状与研究目标、研究方法及过程、研究结果与应用、论文总结。研究背景显示,图像拼接旨在获得视野更广阔的图像,然而由于多张图像叠加的视野很少是完全的矩形,所以在非重叠区域总会存在各种不同分布的不规则的边界,同时由于现有算法无法获得完美的对齐,难以避免的在重叠区域的边界处会出现纹理错位从而形成拼接缝。然后,介绍了三种研究方法:使用扩散模型(diffusion model)这种生成式模型作为补全模型;构建算法计算不规则边界与拼接缝的位置生成掩码;构建一种能将图像以任意分辨率表示且感知损失尽可能低的算法。实践难点在于:计算资源需求高、数据质量依赖和复杂的超参数调优。最后,他展示了研究结果,对研究结果进行了分析,并对论文进行了总结,也给我们提出了一些小建议。
廖一镓同学汇报的主题是宽动态范围激光雷达测距系统研究,他的讲解主要包括以下六部分:选题背景及意义、研究内容、硬件电路设计、控制程序设计、样机调试、论文总结。他首先介绍了选题背景,在无人驾驶汽车领域中,激光雷达作为最重要的传感器之一,在无人物流车、自动驾驶汽车补盲等领域的应用与交通工程息息相关。并指出激光雷达、毫米波雷达和摄像头是公认的自动驾驶的三大关键传感器技术。然后,介绍了激光雷达测距原理、激光雷达测距原理与基本构成、激光雷达时刻鉴别原理和tdc芯片计时原理。他还对硬件电路设计和控制程序设计以及样机调试进行了详细地讲解,通过对实验结果的分析得出了相应结论。最后,对论文进行了总结,并提出了对未来研究工作的展望。
谭敏聪同学汇报的主题是基于邻层引导的场景文本检测方法,他的讲解主要包括以下四部分:选题背景及意义、现状与研究目标、研究方法及过程、研究结果与应用。首先,他介绍了该课题的研究背景和意义,并指出深度学习的引入使得适应各类场景的场景文本检测成为可能。对于特征融合不充分、文本信息复杂以及小文本难检测的现有问题,他提出了研究目标:删除自顶向下的路径,改使用跨层级引导;跨层级引导,以及权衡高低层级的信息比重;尝试在分割的任务中引入回归方法的要素:拟合文本实例,捕获长程依赖。然后,对研究方法、过程进行了详细地讲解,同时指出其改进方法在于特征融合部分与预测头部分。最后,他展示了研究结果与应用,并对进行了总结。
罗永曦
2021级电子与通信工程学院
电子与通信工程学术/专业型硕士
导师:王杰
主要研究方向:无人机图像拼接,扩散模型
主要科研成果:elimination of irregular boundaries and seams for uav image stitching with a diffusion model. remote sensing,(sci q1,中科院二区,共一)
廖一镓
2021级电子与通信工程学院
交通运输专业型硕士
导师:魏巍副教授
主要研究方向:激光雷达
主要科研成果:
第十八届中国研究生电子设计竞赛华南分赛区团队一等奖;
第7届中国(国际)传感器创新创业大赛华南分赛区三等奖;
国家发明专利——一种差分时刻鉴别的拟合时刻鉴别系统。
谭敏聪
2021级电子与通信工程学院
电子与通信工程专业型硕士
导师:彭绍湖
主要研究方向:文本检测
主要科研成果:一篇ei会议论文,一篇专利