|
|
|
|
4月15日晚,清华大学计算机科学与技术系教授,博士生导师 孙茂松作客黄浦江源大讲堂,为极速体育师生带来了一场题为“大数据与自然语言处理”的学术报告副校长万健教授主持报告会。
孙茂松通过《爆发:大数据时代预见未来的新思维》、《黑天鹅》两本畅销书,引出大数据能产生洞察力这一话题,他用详实的例证,为现场师生说明了语言计算的本质是结构预测。他指出汉语是世界上最难被计算机理解的语言之一,实时正确解读互联网中的海量中文信息,可实现高精准舆情分析,最大限度地弘扬正能量,同时抑制负能量的滋生和蔓延。但目前中文语义分析准确率仅有60%,机器无法及时理解并充分利用互联网中文信息,是困扰我国相关核心技术手段发展的根本原因。
孙教授向大家介绍了大数据条件下的自然语言处理,机器翻译、自动问答、纵横关联分析、群体智慧、知识图谱,应该如何通过机器阅读理解互联网,孙教授通过实例讲解了计算机自动作对联、云计算、Twitter应用。孙教授说,现阶段对于机器阅读互联网方面的技术存在很大局限性,并鼓励同学们努力学习,争取填补这一空白。
孙教授通过通俗的语言、精准的描述,深入浅出为大家讲解了大数据与自然语言的处理, 随后的互动环节孙茂松回答了同学的提问,并就相关问题与同学们展开了热烈讨论。
学生记者 邵思妤/摄 |