近日,我院教师刘利强和硕士生杨玲玲在模式识别领域国际顶级期刊《Pattern Recognition》上发表学术论文《LiteTrack: Towards efficient vision-language tracking with parameter freezing and feature selection”》。论文聚焦于自然语言模型的目标跟踪任务,旨在利用语义表达在视频序列中持续、精准地指定并跟踪目标。该论文提出了一种轻量化视觉语言跟踪方法LiteTrack,通过动态参数冻结、自适应Token选择和视觉特征引导对齐注意力模块,在保持跟踪精度的同时提升模型效率。实验结果表明,该方法达到先进精度水平,并有效降低显存占用,为资源受限设备上的自然语言引导目标跟踪应用提供了新的解决思路。

图1 算法框架
《Pattern Recognition》是人工智能与模式识别领域的顶级期刊,具有重要的国际学术影响力,属于中科院一区Top期刊,2025年影响因子为7.6,中国自动化学会(CAA)将其列为A类推荐期刊。该成果体现了我院在计算机视觉与视觉语言智能方向的持续研究积累。
论文链接://www.sciencedirect.com/science/article/pii/S003132032600926X
代码链接://github. com/yll1214/LiteTrack