文本-视觉模态感知与交互下的内容生成、定位和导航等任务的研究。
个人简介
讲师/师资博士后,硕士研究生导师,银河集团9873.cσm人工智能与自动化学院、北京人工智能研究院教师。2021年6月毕业于大连理工大学,同年7月入职北京工业大学。目前主持国家自然科学基金-青年项目、第7批博士后创新人才支持计划等5项科研/人才项目,参与科技创新2030“新一代人工智能”重大项目、国家自然科学基金面上项目等6项科研项目,发表论文近20篇,授权发明专利2项;担任知名刊物审稿人,包括IEEE TIP/TIFS/TMM/TCSVT/CVPR20-23/ICCV-23等;担任中国图学学会可视化与认知计算专业委员会委员,计算机学会智能机器人专委会委员;获得辽宁省优秀博士学位论文、辽宁省优秀博士毕业生、博士研究生国家奖学金等。
教育简历
2015年9月-2021年6月 大连理工大学 博士
2011年9月-2015年7月 东北电力大学 学士
工作履历
2021年7月-至今 北京工业大学 讲师/师资博士后
学术兼职
CCF中国计算机学会智能机器人专委会委员;
中国图学学会可视化与认知计算专委会委员;
国际期刊及会议 IEEE TIP/TIFS/TMM/TCSVT/CVPR20-23/ICCV-23等审稿人。
课程教学
本科生教学:C++程序设计基础、 Python程序设计基础。
科研项目
1. 第7批中国博士后创新人才支持计划项目 2022.07-024.07 主持
2. 国家自然科学基金-青年基金 2023.01-2025.12 主持
3. 第70批博士后面上项目 2022.01-2024.07 主持
4. 北京市博士后科研活动经费 2022.04-2024.07 主持
5. 朝阳区博士后科研活动经费 2023.05-2024.07 主持
荣誉和获奖
2022年 中国博士后创新人才支持计划获得者 (博新计划)
2022年 辽宁省优秀博士学位论文 (省优博)
2021年 辽宁省优秀博士毕业生
2020年 博士研究生国家奖学金
代表性研究成果
本人长期进行文本-视觉内容生成,定位与导航任务进行研究。
针对文本至视觉生成的语义一致性问题:
(1)提出了语义增强生成模型;
(2)提出了知识传输的生成算法;
(3)提出了分布正则化模型。
针对布局合理化问题:
(1)提出了自适应注意力布局约束机制,和布局中心点约束机制;
(2)提出了布局区域视觉增强的判别模型。
针对行人重识别任务中的遮挡问题:
(1)提出了多头注意力网络结构,
(2)提出了多头块擦除网络。
针对域泛化问题:
(1)提出了域风格域感知信息迁移机制,和行人特征增强模型等;
(2)提出了信息攻击与防御模型等。
针对文本指代视觉对象定位任务的模态感知问题:
(1)提出了跨模态全局与局部交互感知网络,
(2)提出了中心词解析目标筛选机制等。
主要论文论著
目前在国内外期刊或会议IEEE TIP/TNNLS/TMM/TCSVT/ICCV、计算机辅助设计与图形学学报、计算机工程与科学等发表论文近20篇。
[1] Hongchen Tan, Xiuping Liu, Meng Liu, Baocai Yin and Xin Li. KTGAN: Knowledge Transfer Generative Adversarial Network for Text-to-Image Synthesis. IEEE TRANSACTIONS ON IMAGE PROCESSING (TIP). vol. 30, pp. 1275-1290, 2021. ( CCF A 中科院1区 IF=11.041 SCI)
[2] Hongchen Tan, Xiuping Liu, Xin Li, Yi Zhang, Baocai Yin. Semantics-Enhanced Adversarial Nets for Text-to-Image Synthesis. IEEE International Conference on Computer Vision (ICCV) 2019: 10500-10509. ( CCF A 类会议 EI)
[3] Hongchen Tan, Xiuping Liu, Baocai Yin, and Xin Li. MHSA-Net: Multi-Head Self-Attention Network for Occluded Person Re-Identifification. IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022. ( CCF B 中科院1区 IF=14.255 SCI)
[4] Hongchen Tan, Xiuping Liu, Baocai Yin, Xin Li. DR-GAN: Distribution Regularization for Text-to-Image Generation. IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022. (CCF B 中科院1区 IF=14.255 SCI)
[5] Hongchen Tan, Xiuping Liu, Baocai Yin, and Xin Li. Cross-modal Semantic Matching Generative Adversarial Networks for Text-to-Image Synthesis. IEEE TRANSACTIONS ON MULTIMEDIA (TMM). vol.24, pp. 832-845, 2022. (CCF B 中科院1区 IF=8.182 SCI)