搜索
查看: 360|回复: 0

大模型专题精选第三期:应用与挑战

[复制链接]
发表于 2024-8-9 10:03:01 | 显示全部楼层 |阅读模式
本帖最后由 中国计算机学会 于 2024-8-9 10:35 编辑



本期看点:如何抓住ChatGPT风口、ChatGPT的应用和挑战、对话式大型语言模型等3篇大模型相关内容全文

如何抓住ChatGPT风口—凌棕
CCF企智会寒山论坛第1期——ChatGPT与产业变革
精彩内容节选
        ChatGPT最基本的道理就是,我们原来的人工智能、神经网络的学习方式、纯数学模型不能够解决这些具体的问题。你去搜索一套东西,他找出个东西,关键词都堆在那儿。但是它不能像人一样帮你总结归纳好,变成一个拟人化的问答形式。怎么样让机器谈话更像人,这就要加入一些微调和模型。实际上就是把人类的模型和经验加入到了这样一个系统当中。纯数学模型解决不了这些问题,这是ChatGPT的一个重大的特点。
        这里边涉及到了一个理念,就是人类的智能和人工智能之间到底有什么区别?人工智能我们认为它就是把人类智能中可计算的部分,变成了计算机可以做的事。典型的适应领域就是规则要清晰稳定,所以下棋是最容易实现的一种形式......


ChatGPT的应用和挑战—童先明
CCF企智会寒山论坛第1期——ChatGPT与产业变革
精彩内容节选
        算法在模拟人脑的信息处理方法并在超越。回顾一下人类的思维特点。人看过一些事情,或者读过的一本书,有时候会健忘,我们对细节的发现实际上是有限的,我们的计算能力和我们的复制能力也有限。
        从深度学习算法角度来说,有一个非常有名的机制叫注意力分析。他就是在模拟对事情的注意,他还有一个删选机制,Dropout这个场景非常有效的,深度学习和一些传统的机器学习有很大的区别。传统的机器学习是你要去找特征。
        比如说我这个算法里面可能要考虑天气的,考虑风力因素,可能考虑这个场地的因素。但是深度学习它是自动通过算法来帮你搞配置。这也导致了现在深度学习、ChatGPT已经达到1780亿的参数。这是一个非常大的一个机会......


对话式大型语言模型—邱锡鹏
CCF企智会寒山论坛第1期——ChatGPT与产业变革
精彩内容节选
        ChatGPT中三个非常重要的技术,一个就是情景学习,第二个是思维链,第三个就是指令学习。
        思维链其实是谷歌的研究员发现的。他发现了在原来的语言模型,比如说经过代码预训练之后,这个模型具备一种初步推理的能力。我们可以看左边,传统的方式是给你个情景学习的例子,我们的语言不太能够知道,我应该按第一种方式推出,他也是模仿的推出,但是这个答案是错的。
       但是如果我们把这个复杂问题,用这种思维链的方式来展开,就是一步步告诉他怎么做,我们可以看到右边这个,他就可以按照我们推导的这个例子,一步步向前走。
       思维链是一个非常重要的技术,因为之前我们的模型是随着参数规模的扩大,它的能力会变得越大,但是边际效应也是会慢慢变弱。但是思维链的出现,它就让我们在同级别的模型对比下,通过思维链的方法解决问题,进一步强化能力......


本论坛发布的所有内容,包括但不限于文字、图片、音频、视频、图表、程序等,除特别标明外,均来源于CCF数字图书馆,版权归原作者或原出处所有。若涉及版权问题,请及时联系我们进行处理。
回复

使用道具 举报

您需要登录后才可以回帖 登录

手机版|CCF Link ( 版权所有 中国计算机学会  京ICP备13000930号-4|京公网安备 11010802032778号   )

GMT+8, 2025-4-27 06:23 , Processed in 0.042887 second(s), 20 queries .

快速回复 返回顶部 返回列表