百度科技与社会研究中心主任余欢:大语言模型重在智商和情商
8月16日,以“大模型见真章”为主题,北京商报深蓝智库举行AI专题分享会,复盘大模型过去200多天的经历,并从中探寻大模型商业化落地的可行之径。会上,百度科技与社会研究中心主任余欢提到,这一波大模型的兴起不是AI概念第一次被热炒,经过70多年发展,人工智能经历了几次起伏,但不同的是,这一波大模型不再是泡沫型发展,而是已经成为当下人工智能的主流方向,“当所有人都相信这种发展时,就未必是泡沫了”。
【资料图】
余欢表示,相比起之前的人工智能,这一波大模型的特点是泛化性更强、标准化程度更高、工业化发展趋势更明显。大模型解决的是中长尾的问题,即很多定制化场景无法解决的问题,能够在小样本、小数据的基础上,以相对低成本的情况满足场景化需求。
此外,余欢提到,相比起之前的模型,大语言模型的特点主要分为两部分:情商和智商。当下人们更多解决的是智商问题,即能理解、有逻辑、会推理、能创作,但未来就会向“有感情”去努力,也就是说情商会成为大模型未来一段时间内进一步提升的能力。
据了解,早在2019年3月,文心大模型1.0版本便已发布,此后逐步迭代。今年3月,百度文心一言发布,底层由文心大模型3.0版本支持,更多以辨别式为主、生成式为辅。今年6月,文心大模型从3.0版本升级到3.5版本,比例出现了明显的扭转,大概7分生成式、3分辩别式。通过飞桨与文心协同优化,文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
余欢强调,文心一言有几个核心能力,除了大模型比较通用的基础能力,如有监督精调、人类反馈的强化学习以及提示外,还包括知识增强、检索增强以及对话增强。
以知识增强为例,百度拥有全球最大的中文知识图谱体系,在使用时可以分为知识内化和知识外用两部分,前者意味着在训练模型时可以将这些“关系”投入进行前置性训练,后者表示在推理过程中,如果一些问题在知识图谱里面构建过准确率可能会更高。
今年6月,ChatGPT首次出现流量负增长,一时延伸出业内的各种讨论。对此,余欢表示,ChatGPT流量下滑的逻辑类似于“打江山容易守江山难”,随着时间的推移,剔除一定猎奇心态后,自然会面临有多少用户黏性的问题。但对中国大模型企业而言,流量不仅没有见顶,甚至可以说是还没开始。
“当下C端还未完全放开,从百度的角度来说,我们正处于一种摩拳擦掌等待放开的心态,期待更多流量的提升。”余欢称。
至于商业化,余欢认为,要从付费和真正覆盖成本实现盈利两个方面看。虽然当下尚未出现大规模的批量化落地,但几家大模型厂商已经实现了零星的商业化落地,预计年底可能会出现一些典型的商业化落地案例。此外,预计起步阶段,B端的商业化速度可能会超过C端,C端则可能在爆发速度上更胜一筹。
北京商报记者 杨月涵
标签:
相关文章
刚刚,华为官宣:华为Mate60Pro+ 华为MateX5正式开启预订!有这几款配置,速看......
刚刚,华为手机官宣:今天,华为Mate60Pro+、华为MateX5加入先锋计划,