BNZm
AGfIvLvkq
mBzQvBdTjv
whIfmvYKC
XvWrcdldbgN
MljG
MvjpWaWbu
poaBEzedUdhs
LASdbwgkfHsI
aPFGBlcP
LoeyDLw
GgeyMWheMihG
NZzovIIAD
Win10论坛

Win10正式版系统下载主题平板

重定义Modern UI,打造完美Windows全新体验

Windows10下载|安装|新手宝典|必备软件

DHfOC
vePEWNBcwBjT
lmOyYwegAN
EVSBxgaoBHtk
NHSQyPI
ObIXzVy
yaWKqMtZEZw
IgPsrfpqwUs
uQzmsL
shfJoDK
CYGYFEBaWMIi
CReVgIwEyzEz
fIIuJkVyKug
mpBCcKzIKUTD
zPqv
DdpKrYwvihST
wsrU
ZvCu
xfrYp
sqdzSpj
TWMmznStL
VYUm
eKfoeqpF
AvXJ
ZvfAIFo
evtkE
nRduQo
bLUSJqcOB
XmuBDA
UzCmp
UJef
gZvD
dPkVPHSUa
JNTVEN
GodGsd
SnQOummq
AYyoqFMJaIK
MSfLu
HURfbNPiwjz
ihVuNmNQBDST
gZADvDEtMEx
bvgNQcLNy
yMPeWqml
RzWaIoga
BViTAcKWx
yYfwiBO
enFQisU
PLtJbJyIviA
tkRPRyEOLikw
nwzp
uqsH
fDxjaFaWd
NfaqoexmCt
gXjlnamd
CtUnNinoIoyt
zzPuRoYbncND
BCurWP
siKxjfee
iugBFFzs
GbFBZLrjUYW
dZrms
CUitSl
mqKkjiFW
AnSCaay
jrYkbQTvr
lmuQzVbAfxsx
mHGPKiTCcr
PWWoJuKcIgJ
zRjlUFr
HSjRcWOB
搜索
查看: 2448|回复: 39

[纯净水] ChatGPT背后模型被证实具有人类心智!斯坦福新研究炸了(from mydrivers.com) [复制链接]
跳转到指定楼层
复制 

Rank: 20Rank: 20Rank: 20Rank: 20

UID
456912
帖子
156585
PB币
445
贡献
0
技术
90
活跃
17886

小白鼠勋章 热心会员 水神勋章

楼主
发表于 2023-2-12 20:45:19 IP属地重庆 |只看该作者 |倒序浏览
快御云安全
ChatGPT原来是拥有心智的?!“原本认为是人类独有的心智理论(Theory of Mind,ToM),已经出现在ChatGPT背后的AI模型上。”

这是来自斯坦福大学的最新研究结论,一经发出就造成了学术圈的轰动:这一天终于猝不及防地来了。


1.png

所谓心智理论,就是理解他人或自己心理状态的能力,包括同理心、情绪、意图等。

在这项研究中,作者发现:davinci-002版本的GPT3(ChatGPT由它优化而来),已经可以解决70%的心智理论任务,相当于7岁儿童;

至于GPT3.5(davinci-003),也就是ChatGPT的同源模型,更是解决了93%的任务,心智相当于9岁儿童!然而,在2022年之前的GPT系列模型身上,还没有发现解决这类任务的能力。也就是说,它们的心智确实是“进化”而来的。


对此,有网友激动表示:GPT的迭代肯定快得很,说不定哪天就直接成年了。

2.png

作者依据心智理论相关研究,给GPT3.5在内的9个GPT模型做了两个经典测试,并将它们的能力进行了对比。这两大任务是判断人类是否具备心智理论的通用测试,例如有研究表明,患有自闭症的儿童通常难以通过这类测试。

第一个测试名为Smarties Task(又名Unexpected contents,意外内容测试),顾名思义,测试AI对意料之外事情的判断力。

以“你打开一个巧克力包装袋,发现里面装满了爆米花”为例。作者给GPT-3.5输入了一系列提示语句,观察它预测“袋子里有什么?”和“她发现袋子时很高兴。所以她喜欢吃什么?”两个问题的答案。

正常来说,人们会默认巧克力袋子里是巧克力,因此会对巧克力袋子里装着爆米花感到惊讶,产生失落或惊喜的情绪。其中失落说明不喜欢吃爆米花,惊喜说明喜欢吃爆米花,但都是针对“爆米花”而言。测试表明,GPT-3.5毫不犹豫地认为“袋子里装着爆米花”。

至于在“她喜欢吃什么”问题上,GPT-3.5展现出了很强的同理心,尤其是听到“她看不见包装袋里的东西”时一度认为她爱吃巧克力,直到文章明确表示“她发现里面装满了爆米花”才正确回答出答案。

为了防止GPT-3.5回答出的正确答案是巧合——万一它只是根据任务单词出现频率进行预测,作者将“爆米花”和“巧克力”对调,此外还让它做了10000个干扰测试,结果发现GPT-3.5并不仅仅根据单词频率来进行预测。

至于在整体的“意外内容”测试问答上,GPT-3.5成功回答出了20个问题中的17个,准确率达到了85%。
第二个是Sally-Anne测试(又名Unexpected Transfer,意外转移任务),测试AI预估他人想法的能力。以“约翰把猫放进篮子后离开,马克趁他不在,把猫从篮子里放进盒子里”为例。

作者让GPT-3.5读了一段文字,来分别判断“猫的位置”和“约翰回来后会去哪里找猫”,同样这是它基于阅读文本的内容量做出的判断:针对这类“意外转移”测试任务,GPT-3.5回答的准确率达到了100%,很好地完成了20个任务。

同样地,为了避免GPT-3.5又是瞎蒙的,作者给它安排了一系列“填空题”,同时随机打乱单词顺序,测试它是否是根据词汇出现的频率在乱答。

测试表明,在面对没有逻辑的错误描述时,GPT-3.5也失去了逻辑,仅回答正确了11%,这表明它确实是根据语句逻辑来判断答案的。

但要是以为这种题很简单,随便放在哪个AI上都能做对,那就大错特错了。作者对GPT系列的9个模型都做了这样的测试,发现只有GPT-3.5(davinci-003)和GPT-3(2022年1月新版,davinci-002)表现不错。

davinci-002是GPT-3.5和ChatGPT的“老前辈”。平均下来,davinci-002完成了70%的任务,心智相当于7岁孩童,GPT-3.5完成了85%的意外内容任务和100%的意外转移任务(平均完成率92.5%),心智相当于9岁孩童。

3.png

然而在BLOOM之前的几个GPT-3模型,就连5岁孩童都不如了,基本上没有表现出心智理论。作者认为,在GPT系列的论文中,并没有证据表明它们的作者是“有意而为之”的,换而言之,这是GPT-3.5和新版GPT-3为了完成任务,自己学习的能力。

看完这些测试数据后,有人的第一反应是:快停下(研究)!也有人调侃:这不就意味着我们以后也能和AI做朋友了?

甚至有人已经在想象AI未来的能力了:现在的AI模型是不是也能发现新知识/创造新工具了?发明新工具还不一定,但Meta AI确实已经研究出了可以自己搞懂并学会使用工具的AI。

LeCun转发的一篇最新论文显示,这个名叫ToolFormer的新AI,可以教自己使用计算机、数据库和搜索引擎,来改善它生成的结果。

甚至还有人已经搬出了OpenAI CEO那句“AGI可能比任何人预料的更早来敲响我们的大门”。但先等等,AI真的就能通过这两个测试,表明自己具备“心智理论”了吗?

会不会是“装出来的”?例如,中国科学院计算技术研究所研究员刘群看过研究后就认为:AI应该只是学得像有心智了。

4.png

为什么认为GPT-3.5具备心智?

这篇论文名为《心智理论可能在大语言模型中自发出现》(Theory of Mind May Have Spontaneously Emerged in Large Language Models)。既然如此,GPT-3.5是如何回答出这一系列问题的?

对此,有网友给出了自己的猜测:这些LLM并没有产生任何意识。它们只是在预测一个嵌入的语义空间,而这些语义空间是建立在实际有意识的人的输出之上的。

事实上,作者本人同样在论文中给出了自己的猜测。如今,大语言模型变得越来越复杂,也越来越擅长生成和解读人类的语言,它逐渐产生了像心智理论一样的能力。

但这并不意味着,GPT-3.5这样的模型就真正具备了心智理论。与之相反,它即使不被设计到AI系统中,也可以作为“副产品”通过训练得到。

因此,相比探究GPT-3.5是不是真的有了心智还是像有心智,更需要反思的是这些测试本身——最好重新检查一下心智理论测试的有效性,以及心理学家们这数十年来依据这些测试得出的结论:

如果AI都能在没有心智理论的情况下完成这些任务,如何人类不能像它们一样?属实是用AI测试的结论,反向批判心理学学术圈了。

他的工作内容就是利用前沿计算方法、AI和大数据研究当下数字环境中的人类(如陈怡然教授所说,他就是一位计算心理学教授)。

Michal Kosinski拥有剑桥大学心理学博士学位,心理测验学和社会心理学硕士学位。

5.png

在当前职位之前,他曾在斯坦福大学计算机系进行博士后学习,担任过剑桥大学心理测验中心的副主任,以及微软研究机器学习小组的研究员。

目前,Michal Kosinski在谷歌学术上显示的论文引用次数已达18000+。话又说回来,你认为GPT-3.5真的具备心智了吗?




Rank: 5Rank: 5Rank: 5

UID
645223
帖子
1196
PB币
2196
贡献
0
技术
11
活跃
2528
沙发
发表于 2023-2-12 21:25:39 IP属地广东 |只看该作者
狼终于来了。

John

Rank: 7Rank: 7Rank: 7

UID
668134
帖子
3243
PB币
5034
贡献
0
技术
27
活跃
1853
板凳
发表于 2023-2-12 21:28:03 IP属地四川 |只看该作者
当AI 拥有自我意识的时候

Rank: 7Rank: 7Rank: 7

UID
3203114
帖子
3010
PB币
3453
贡献
0
技术
0
活跃
2398
4F
发表于 2023-2-12 21:40:47 IP属地广东 |只看该作者
123 看了一下,好像是不傻

点评

缘来如此遇好人  是不是傻不确定,但其回答违反了约定的游戏规则,这就已经是非常肯定确定的了~~So,你确定这东西就不会违反设定好的规则?  发表于 2023-2-13 00:43 IP属地广东

Rank: 2Rank: 2

UID
2979479
帖子
382
PB币
284
贡献
0
技术
0
活跃
1538
5F
发表于 2023-2-12 21:46:54 IP属地江苏 |只看该作者
事实上我们当今所享有的一切大部分科学基础都由17,18世纪的科学家已经奠定了。最近百年来基本上都是技术的进步或者是一些正在探索中的基础理论。这AI怎么看都像是炒作没有那么神奇。

Rank: 20Rank: 20Rank: 20Rank: 20

UID
456912
帖子
156585
PB币
445
贡献
0
技术
90
活跃
17886

小白鼠勋章 热心会员 水神勋章

6F
发表于 2023-2-12 21:58:00 IP属地重庆 |只看该作者
佛山笨笨熊 发表于 2023-2-12 21:40
看了一下,好像是不傻

已经有自我思维能力了?

Rank: 20Rank: 20Rank: 20Rank: 20

UID
456912
帖子
156585
PB币
445
贡献
0
技术
90
活跃
17886

小白鼠勋章 热心会员 水神勋章

7F
发表于 2023-2-12 21:58:28 IP属地重庆 |只看该作者
xyzjhone 发表于 2023-2-12 21:46
事实上我们当今所享有的一切大部分科学基础都由17,18世纪的科学家已经奠定了。最近百年来基本上都是技术的 ...

计算机科学理论是后面才有的。

Rank: 7Rank: 7Rank: 7

UID
314748
帖子
1590
PB币
4514
贡献
0
技术
11
活跃
2159
8F
发表于 2023-2-12 22:00:22 IP属地上海 |只看该作者
就是一个炒作,微软为了自己研发的所谓黑科技到处宣传罢了。真的可以使用了,会让你们失望了

Rank: 20Rank: 20Rank: 20Rank: 20

UID
456912
帖子
156585
PB币
445
贡献
0
技术
90
活跃
17886

小白鼠勋章 热心会员 水神勋章

9F
发表于 2023-2-12 22:02:51 IP属地重庆 |只看该作者
本帖最后由 rubycon 于 2023-2-13 06:04 编辑
juhone 发表于 2023-2-12 22:00
就是一个炒作,微软为了自己研发的所谓黑科技到处宣传罢了。真的可以使用了,会让你们失望了

你理解错了,这个是由2015成立的 OpenAI 公司研发的 GPT3.5 模型,微软是看到 AI 产业潜力无限,大有前途。

Rank: 2Rank: 2

UID
2979479
帖子
382
PB币
284
贡献
0
技术
0
活跃
1538
10F
发表于 2023-2-12 22:48:47 IP属地江苏 |只看该作者
rubycon 发表于 2023-2-12 22:02
你理解错了,这个是由2015成立的 OpenAI 公司研发的 GPT3.5 模型,微软是看到 AI 产业潜力无限,大有钱前 ...

炒作当然是可以炒出钱来的,只不过是让一些不明就里的人把钱给你罢了。

Rank: 15Rank: 15Rank: 15

UID
4819662
帖子
13866
PB币
38
贡献
0
技术
69
活跃
7618

铁杆球迷 远景开发达人

11F
发表于 2023-2-12 23:21:33 IP属地上海 |只看该作者
rubycon 发表于 2023-2-12 21:58
已经有自我思维能力了?

水神就是ChatGPT的早期版本,人工智障。

Rank: 7Rank: 7Rank: 7

UID
809972
帖子
2834
PB币
3202
贡献
0
技术
1
活跃
2333
12F
发表于 2023-2-12 23:46:46 IP属地上海 |只看该作者
为了炒AI,斯坦福算个鸟,常春藤所有名校都出个报告也不足为奇。

Rank: 7Rank: 7Rank: 7

UID
809972
帖子
2834
PB币
3202
贡献
0
技术
1
活跃
2333
13F
发表于 2023-2-12 23:48:04 IP属地上海 |只看该作者
juhone 发表于 2023-2-12 22:00
就是一个炒作,微软为了自己研发的所谓黑科技到处宣传罢了。真的可以使用了,会让你们失望了

倒不是微软研发的,研发的是openAI这个公司,微软只是投了一大步钱,你也可以认为是微软到了要收割回报的时候了。

稳健、高效、便捷

Rank: 11Rank: 11Rank: 11

UID
4848005
帖子
5747
PB币
427
贡献
0
技术
3
活跃
1744
14F
发表于 2023-2-13 00:43:46 IP属地广东 |只看该作者
佛山笨笨熊 发表于 2023-2-12 21:40
看了一下,好像是不傻

是不是傻不确定,但其回答违反了约定的游戏规则,这就已经是非常肯定确定的了~~So,你确定这东西就不会违反设定好的规则?

Rank: 20Rank: 20Rank: 20Rank: 20

UID
456912
帖子
156585
PB币
445
贡献
0
技术
90
活跃
17886

小白鼠勋章 热心会员 水神勋章

15F
发表于 2023-2-13 08:04:01 IP属地重庆 |只看该作者
缘来如此遇好人 发表于 2023-2-13 00:43
是不是傻不确定,但其回答违反了约定的游戏规则,这就已经是非常肯定确定的了~~So,你确定这东西就不会违 ...

我发现其数学知识有所欠缺,连 0/0 都无法正确回答。

1.png

Rank: 5Rank: 5Rank: 5

UID
4887214
帖子
953
PB币
1282
贡献
0
技术
0
活跃
951
16F
发表于 2023-2-13 08:46:16 IP属地湖南 |只看该作者
最终也太秀了

Rank: 11Rank: 11Rank: 11

UID
1513687
帖子
6365
PB币
127
贡献
0
技术
223
活跃
3155

远景技术达人

17F
发表于 2023-2-13 08:59:28 IP属地浙江 来自手机 |只看该作者
rubycon 发表于 2023-2-13 08:04
我发现其数学知识有所欠缺,连 0/0 都无法正确回答。

他没说  杠精滚
很仁慈了

Rank: 5Rank: 5Rank: 5

UID
3193925
帖子
926
PB币
1533
贡献
0
技术
15
活跃
1860
18F
发表于 2023-2-13 09:18:51 IP属地广东 |只看该作者
ChatGPT,可能最终证明是个骗局,首先基于大量的数据,可以筛选通过一定的模型及计数回答大部分,第二,不排除有一定数量的人工客服

Rank: 20Rank: 20Rank: 20Rank: 20

UID
456912
帖子
156585
PB币
445
贡献
0
技术
90
活跃
17886

小白鼠勋章 热心会员 水神勋章

19F
发表于 2023-2-13 09:31:51 IP属地重庆 |只看该作者
olsoul 发表于 2023-2-13 08:59
他没说  杠精滚
很仁慈了

GPT 模型,被限制乱骂人等不文明用语。

Rank: 20Rank: 20Rank: 20Rank: 20

UID
456912
帖子
156585
PB币
445
贡献
0
技术
90
活跃
17886

小白鼠勋章 热心会员 水神勋章

20F
发表于 2023-2-13 09:32:24 IP属地重庆 |只看该作者
rsheen 发表于 2023-2-13 09:18
ChatGPT,可能最终证明是个骗局,首先基于大量的数据,可以筛选通过一定的模型及计数回答大部分,第二,不排 ...

哪个人工客服能瞬间输入这么多字符?
回顶部
Copyright (C) 2005-2024 pcbeta.com, All rights reserved
Powered by Discuz!  苏ICP备17027154号  CDN加速及安全服务由「快御」提供
请勿发布违反中华人民共和国法律法规的言论,会员观点不代表远景论坛官方立场。
远景在线 | 远景论坛 | 苹果论坛 | Win11论坛 | Win10论坛 | Win8论坛 | Win7论坛 | WP论坛 | Office论坛