当前位置:首頁 > 文章訊息 > 正文内容

短评:自然语言处理呼唤中国方案 云服务将从数字时代到智能时代

admin3年前 (2023-02-16)文章訊息222

  信息社会50人论坛执行主席 段永朝

  2023年2月16日

  美国OpenAI公司的ChatGPT甫一推出,即掀起全球浪潮。一时间各种惊艳测试令人目不暇接。ChatGPT在文档摘要、内容撰写、机器翻译、问题解答等领域的非凡表现,成为2023年度智能科技领域的抢眼新闻。

  ChatGPT是人工智能传统领域自然语言处理(NLP)的创新模式,基于GPT3.5语言模型、Transformer机器学习模型和无监督、半监督-微调预训练技术,通过巨量参数、海量文本数据的训练和学习,具备强大的文本生成能力。

  值得注意的是,ChatGPT的技术路线,有着鲜明的计算语言学演进的特征。理论计算语言学以语法解析和语义的形式理论研究为核心,通常以形式逻辑和符号方法为基础,包括自然语言的计算复杂性、应用上下文相关语法和线性有界图灵机模型等。

  1990年以来,计算语言学一直以统计方法为主,如神经网络和机器学习。神经网络方法因为缺乏统计可解释性受到一定程度的排斥。直到2015年前后,深度学习方法NLP的主要框架。这里重大的突破在于Transformer机器学习模型中使用的自注意力机制,即对输入数据的每一部分的重要性进行差异性加权。

  注意力模型的思想,缘于心理学家William James在130年前提出的“认知注意力”概念。James提出注意力的“聚光灯模型”将注意力分为两个阶段:一个阶段是注意力在视场中的均匀分布,这时候信息获得并行处理;另一个阶段是注意力的聚焦过程,这时候信息是串行处理的。

  1986年,Charles W. Eriksen & James D. St. James提出了变焦镜头模型,为注意力模型增加了环境变量的调节参数。

  ChatGPT所使用的自注意力机制,实际上就是这种变焦注意力处理过程在数据编码-解码过程中的延伸应用。传统自然语言处理过程中的编码-解码过程,采用通用计算框架,实质上是“注意力散光”过程。ChatGPT所采用的自注意力机制,在每个编码-解码过程中,都加入了自我注意机制,从而大大加强了预训练的效果。

  但是,需要看到的是,ChatGPT无论取得了何种成就,其语言模型的基本思想,依然是乔姆斯基的形式语法、瑞士语言学家索绪尔的“能指-所指”两分法。也就是说,以英语(屈折语言)为主要研究对象的主流自然语言处理技术,不可避免地带有乔姆斯基“存在先天语法结构假设”,以及索绪尔“符号、语音、对象可分离假设”这两个重要的假设。

  对中文语境的研究者、开发者和使用者来说,这两个假设在汉语环境下是否依然成立,是一个基础性问题。

  ChatGPT的火爆,其实更应该引发深层次的思考。著名语言学家萨丕尔、沃尔夫,在100多年前曾经指出“语言决定人的认知”;认知语言学的创始人莱考夫也说,在语言认知过程中,需要特别重视“隐喻”的认知价值(1980)。

  汉藏语系与印欧语系在语音、词汇、语形、语义、语法等层面有诸多不同。汉语的自然语言处理固然可以借鉴当代西方主流的语言模型、处理技术,但从根本上来说,汉语具备的音形义统一的特征需要给予特别的关注。这一点是呼唤中文自然语言处理技术创新发展的关键。

  最近百度的一则新闻引人关注。百度在多年潜心耕耘的基础上推出的“文心一言”大模型,一方面依靠计算技术、人工智能技术的大量积累,另一方面更立足海量中文文本、图形、数据的丰富环境,在中文环境的自然语言处理中独具特色,前景可期。百度核心战略业务之一的智能云未来势必也要接入文心一言,文心一言带来的庞大AI算力和数据需求将为百度智能云提供巨大的营收增量。ChatGPT和文心一言等将使云市场游戏规则发生根本改变,彻底改变云计算厂商的核心竞争力,适合跑AI的云将成为云计算市场领导者,云服务将从数字时代到智能时代。

  当然,这一领域的长足发展,还有赖于语言学家、心理学家、人类学家和计算机科学家的深度合作与创新。

“短评:自然语言处理呼唤中国方案 云服务将从数字时代到智能时代” 的相关文章

{易七百家樂}(餐厅设计理念及说明1000)

{易七百家樂}(餐厅设计理念及说明1000)

餐厅的设计理念是设计师通过对餐饮品牌的文化理念为主导,结合餐厅的商业价值和以市场导向为基准,赋予餐厅艺术化的创作灵感优秀的餐厅设计理念是商业与艺术的完美结合,帮助餐厅提高利润的同时,更体现出餐饮品牌独...

国家统计局:11月飞机票和宾馆住宿价格环比分别下降7.5%和2.9%

  2022年11月份CPI同比涨幅回落   PPI同比继续下降   ——国家统计局城市司首席统计师董莉娟解读2022年11月份CPI和PPI数据   国家统计局今天发布了2022年11月份全国CPI...

快讯:指数午后小幅震荡 钢铁板块震荡走强

快讯:指数午后小幅震荡 钢铁板块震荡走强

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   12月9日消息,三大指数午后小幅震荡,创指拉升翻红后回落。板块方面,新冠检测相关股午后继续冲高,钢铁板块震荡走强,白...

上海置地广场明年1月31日闭店,储值卡在指定日期前可退

上海置地广场明年1月31日闭店,储值卡在指定日期前可退

  “由于商厦与业主的租赁合同期限届满,商厦将于2023年1月31日22:00营业结束以后正式闭店终止经营。”12月9日,位于南京东路步行街旁的老牌商厦上海置地广场在其“告员工书”中宣布了上述消息。...

{易七百家樂}(2022年最好听的歌曲)

{易七百家樂}(2022年最好听的歌曲)

2022年十大网络爆红歌曲1一路生花这首来自音乐人温奕心演唱的歌曲让人非常暖心,歌曲励志,相信大家听完后,能够感觉到更多的力量以及得到更多的鼓舞2叹一首从国外神曲改变过来的歌曲让人听够真是过瘾,这;抖...

{易七娛樂城}(家庭聚餐菜单14个菜名)

{易七娛樂城}(家庭聚餐菜单14个菜名)

今天给各位分享家庭聚餐菜单14个菜的知识,其中也会对家庭聚餐菜单14个菜名进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、小型家庭聚会菜谱推荐 2、10人...