科大讯飞刘聪:大模型本身是深度学习的,比小模型更聪明一点

2024-08-31 21:01:04 体育资讯 无敌椰子

专题:2024亚布力企业家第二十届夏季年会

  新浪科技讯 8月31日下午消息,2024亚布力企业家第二十届夏季年会在广州举行。论坛期间,在东方甄选直播间,新东方教育科技集团董事长俞敏洪与多位企业家对话。

  关于大模型,科大讯飞副总裁、研究院院长刘聪在直播间表示,首先大模型肯定是人工智能的一部分,这几年因为大模型比较火,大家基本上就用大模型来代表人工智能。

  他认为,大模型本身从模型结构上还是一个深度学习的模型,“原来小模型可能是几亿的参数,现在大模型几千亿几万亿的参数,原来小模型可能是1万本书就训练,现在可能把整个互联网上能见到的所有的数据全训练进去。”

  刘聪表示,小模型是特定的,写首诗是一个特定的模型,人脸识别是个特定的模型,现在大模型强调它的专业、通用化,这个模型可以干所有的事儿。“还有,大模型比小模型更聪明一点,原来可能教10遍它才会,现在因为大模型底座能力比较强了,教个两三遍它可能就会了。”

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

搜索
最近发表
标签列表