发布时间:2024-04-26
4月25日,应昆明理工大学信息工程与自动化学院邀请,中国中文信息学会青年工作委员会在昆明理工大学云南省人工智能重点实验室举办学术沙龙活动。出席活动的专家有青工委主任、中国科学院自动化研究所张家俊研究员,武汉大学李晨亮教授、中国科学技术大学徐童教授、中国科学院自动化研究所陈玉博副研究员、中国科学院自动化研究所庞亮副研究员、复旦大学魏忠钰副教授。
活动伊始,信息工程与自动化学院副院长李英娜教授致辞,热烈欢迎各位专家学者来访,并介绍了昆明理工大学和信息工程与自动化学院近年来的发展状况。张家俊研究员代表学会对会议的顺利召开表示祝贺,并介绍了中国中文信息学会青年工作委员会的具体情况。会议由昆明理工大学信息工程与自动化学院毛存礼教授主持。
报告环节,与会专家聚焦多模态大模型、信息检索等领域的热点话题,结合自己的研究成果进行了精彩的报告,并与参会师生进行了研讨。
李晨亮教授带了题为“基于表征解耦的用户个性化视觉意图研究”的报告。报告从多模态搜索场景的发展及业务场景切入,介绍了如何利用表征解耦的技术去解耦用户历史点击商品的视觉信息,以更准确地捕捉和理解用户在进行视觉搜索时的真实意图和偏好。
徐童教授报告题目为“大模型增强的多模态认知智能:探索与尝试”。多模态认知智能已成为人工智能发展的主流趋势之一,旨在通过多模态语义的深度表示与推理,有效支撑面向多媒体场景的富语义下游应用。当下,方兴未艾的多模态大模型依托其强大的语义理解与归纳能力,有望为突破传统多模态技术在感知与整合深度语义线索方面的局限性提供新的助力。针对上述问题,报告总结了团队围绕大模型增强的多模态认知所开展的技术探索,以及针对多模态大模型语义幻觉和高训练开支的改进尝试。
陈玉博副研究员报告主题是“预训练语言模型中的知识分析、萃取与增强”。近年来,大规模预训练语言模型在知识密集型的自然语言处理任务上取得了令人瞩目的进步。这似乎表明,预训练语言模型能够自发地从语料中学习大量知识,并隐式地保存在参数之中。然而,这一现象的背后机理仍然萦绕着许多谜团。语言模型究竟掌握了哪些知识,如何提取和利用这些知识,如何用外部知识弥补模型不足,这些问题都亟待进一步探索。报告重点介绍了预训练语言模型知识分析、知识萃取、知识增强等领域的基础知识和近期研究进展。
庞亮副研究员报告题目是“检索增强大模型技术的探索与思考”。近年来,检索增强的范式有效地提升了大语言模型生成内容的准确性和可信性,其核心组成可以分为信息检索模块和大语言模型生成模块。报告从不同视角探讨了检索增强大模型。在信息检索模块的视角,检索模型的领域可泛化性和通用性,有助于在大模型应用的各个领域精选出对生成有效的信息;在大语言模型模块的视角,对外部信息使用的鲁棒性和效率,有助于避免检索噪声信息对生成结果的影响;在模块间交互的视角,信息检索模块与大语言模型模块交互配合的机制设计,也是成败的关键;最后,在检索增强生成信息回路的视角,新生成的内容将对信息检索造成潜在影响。
魏忠副教授带来了题为“面向数字社会治理的领域大模型建构”的报告。数字社会治理面向智能医疗、智慧司法、数字政府等场景,以大数据为基础,探究社会运行机制,设计人机协同的辅助决策方案。传统的方法遵循数据标注、算法设计和模型训练的流程,面向不同的场景进行智能化流程的设计,存在场景数据利用不充分,模型缺乏复用性和落地系统交互不足的问题。大语言模型的兴起,给数字社会治理提供了新的机会。报告介绍了其团队面向社会治理不同场景推出的微调领域大模型,并介绍了基于大模型完成网络社会运动模拟的工作。
活动尾声,毛存礼教授对本次学术沙龙活动进行了总结,感谢各位专家精心准备学术报告,展示各自的前沿研究成果,为与会者带来了新的思考和启发。本次学术沙龙活动的圆满成功激发了同学们对中文信息处理的研究热情,扩大了中国中文信息学会青年工作委员会的影响力,取得了良好效果。