UM  > Faculty of Arts and Humanities  > DEPARTMENT OF CHINESE LANGUAGE AND LITERATURE
Residential Collegefalse
Status已發表Published
ChatGPT等大模型的语言处理机制及其理论蕴涵
袁毓林1,2
2024-08
Source Publication外国语
ISSN1004-5139
Issue04Pages:2-14
Abstract本文简单解释ChatGPT等现代大型语言模型的语言处理机制和数学原理及其理论蕴涵。首先,通过ChatGPT对代词指称歧义句的理解,来说明语言大模型在语义理解和常识推理方面的性能;接着,介绍转换器这种语言模型的新颖构架,特别是其注意力机制及其功能;还介绍基于分布语义学的词的向量化嵌入表示,以及词向量在语言处理和类比推理方面的作用;然后详细介绍转换器模型怎样通过注意力机制和前馈网络,来追踪和传递词语之间的句法语义关系信息,从而成功地预测下一个词语并生成合适的文本;最后简介语言大模型的训练方式,并说明大模型怎样用“再造语言”的方式,帮助我们重新认识人类自然语言的有关特点(分布性和预测性),启发我们反思既有的句法学和语义学理论。
KeywordChatgpt 语言大模型 转换器 注意力机制 前馈网络 词向量
Indexed By核心期刊 ; CSSCI ; 其他Other
Language中文Chinese
Funding Project面向可解释AI的语义推理模式与机制研究
Document TypeJournal article
CollectionDEPARTMENT OF CHINESE LANGUAGE AND LITERATURE
Affiliation1.澳门大学人文学院中国语言文学系
2.北京大学 中国语言文学系/中国语言学研究中心
First Author AffilicationFaculty of Arts and Humanities
Recommended Citation
GB/T 7714
袁毓林. ChatGPT等大模型的语言处理机制及其理论蕴涵[J]. 外国语, 2024(04), 2-14.
APA 袁毓林.(2024). ChatGPT等大模型的语言处理机制及其理论蕴涵. 外国语(04), 2-14.
MLA 袁毓林."ChatGPT等大模型的语言处理机制及其理论蕴涵".外国语 .04(2024):2-14.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[袁毓林]'s Articles
Baidu academic
Similar articles in Baidu academic
[袁毓林]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[袁毓林]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.