信息科学技术学院研究生学术交流—大语言模型前沿讲座

作者: 日期:2024/11/11

2024年11月5日,信息科学技术学院举办研究生学术交流大语言模型前沿讲座,本次讲座主题为“多语言神经元、推理叙事与大语言模型协同搜索的前沿研究”。讲座特邀来自伦敦国王学院桂林教授、阿里巴巴通义千问团队的唐天一研究员,伦敦国王学院祝清麟博士,中国人民大学高瓴人工智能学院公培元博士作为主讲嘉宾。讲座由信息科学技术学院徐月梅老师主持,吸引了来自不同专业领域的师生参加,现场气氛热烈。


本次讲座内容包括大语言模型的协同搜索系统、大语言模型的多语言神经元探究、以及大语言模型复杂推理理解的探讨。

Part 1: 桂林教授——大语言模型的实际应用

桂林教授以“剧本杀”游戏为例,介绍大语言模型在智能应用中的潜力。他指出,大语言模型在文本生成和游戏创作上具有广阔空间。“剧本杀“作为一种叙事性游戏,模型可以通过对游戏内容进行分析和理解,帮助设计个性化的题词与情节,丰富游戏体验,展现了大语言模型在角色扮演与故事生成方面的可能性。同时,桂林教授借此机会介绍了伦敦国王学院的科研环境与研究方向,并进行了简要的招生宣传。

Part 2: 公培元——基于大语言模型的协同搜索研究

公培元博士详细阐述了基于大语言模型的协同搜索系统研究,当前面临的挑战和解决方向。他指出,大语言模型在协同搜索上具有巨大的潜力,当前模型的能力仍需要人工参与辅助才能过解决复杂场景下的搜索。为了让大语言模型在查询理解、搜索结果展示和答案生成上达到与真人相近的效果,他提出了多项优化方案,包括查询改写、澄清问题生成、网页信息爬取与总结等方法。他还分析了大语言模型相比传统方法在用户需求适应性上的优势,讨论了QAAgentCoSearchAgent等模型智能体的特点与不足。

Part 3: 唐天一——大语言模型多语言神经元的研究方法

唐天一研究员分享了多语言神经元的前沿研究。他指出,大模型内部的神经元类似于人脑的功能性分区,存在语言无关和语言特定的神经元区域。他通过理论分析、实验验证和对比分析,展示了如何识别和激活大模型中的语言特定神经元,详细讲述了实验的原理、过程和结果。同时,唐天一研究员也分享了自己的科研经验,包括选题积累、方法梳理和实验代码的开发。

Part 4: 祝清麟——大语言模型在侦探小说中的复杂推理理解

祝清麟博士以侦探小说的复杂人物关系为切入点,探讨了大语言模型在理解复杂角色关系方面的进展与不足。他指出,人物关系往往具有复杂性、不确定性和主观性,为此需建立标签体系,生成角色视角剧本和全知视角剧本。他还分享了自己在学术成长中的经验,强调在跟随导师学习的同时,培养独立思考的能力。

讲座尾声:系统演示

在讲座的尾声,桂林教授通过一段demo视频,展示了大语言模型在叙事场景中的创新应用。该系统是基于大语言模型开发的虚拟故事游戏,用户可选择在游戏中过扮演的角色,与智能代理进行互动,体现了大语言模型在叙事与角色扮演领域的深度应用。



在本次讲座中,各位嘉宾结合自身研究经验和学术成果,分享了人工智能领域的前沿方法与技术应用,对学生们深入理解大语言模型的工作原理、应用场景及其未来发展具有重要的教育意义。同时,本次活动促进了校内外师生的学术交流,加强了不同科研团队间的联系与合作,为未来的创新研究奠定了基础。

 


Copyright @ BFSU. 北京外国语大学版权所有.   Supported by BFSU ITC
地址:北京市海淀区西三环北路2号/19号    邮编:100089  电话:+86-01088816746      传真:+86-01088816746