学术能力提升系列讲座：基于大数据的语言研究难题与解决方案

发布者：侯卫卫发布时间：2020-07-03浏览次数：1835

6月30日，南京师范大学李斌博士应邀为我院师生在线上开设了题为“基于大数据的语言研究难题与解决方案”讲座，外国语学院近百名师生聆听了此次讲座。

讲座伊始，李博士首先介绍了词语认知属性知识库的构建和应用的研究背景。在词义研究领域，传统的以描写和分析为主的定性研究已无法满足人工智能和语言信息处理产业的发展要求，有必要把基于人工智能的大数据处理应用于语言研究。随后他介绍了大规模词义知识库建设的研究框架：大规模词义知识库的建设，必须引入大数据的视角和技术，以互联网海量语言数据作为分析基础，利用计算机技术进行数据处理，辅以一定的人工校对提高质量。在此基础上使用语言计量分析方法，得出具有统计特性的宏观分析，建立语言计算模型，应用于语言的生成与理解。基于以上框架，李博士介绍了词语认知属性库的建设思路、建设过程、统计分析和建模计算结果。随后，展示了如何利用词语认知属性库来检验“副名结构”，统一模型得出隐喻计算公式，提出理论假设，建立模型的具体过程。李博士认为把人工智能和语言学研究结合是未来该领域研究的必然趋势，也指出了该领域研究主体应掌握语言学知识和一定的数理基础，以及编程能力、数据分析和数学建模能力。

李博士的研究是基于人工智能的大数据在汉语词义研究方面一个很好的示范，讲座引起了与会人员对大数据应用语言学的研究方案的浓厚兴趣，李博士耐心细致的回答了听众的很多问题，气氛热烈。

最后，外国语学院王静萍院长对讲座进行了总结，并对李博士表示了感谢，也希望此次讲座能为师生的学术能力提升打开新的思路。