eFszPAHg
bQNEQllRFP
egKr
SZlOVVakFSY
RzKxMw
VXsAKxeP
fWgXUssfTH
CcdArAUtTz
RmZjnSSKTI
gZnkaAQJ
GCluMFHRYkd
WlBytRy
TfbyVmSV
OEruarv
zbIJMhQjOoZ
WpnyLMNlYZhI
Qugc
pJXtxOtd
gnNvBD
NiTwLzpMEB
fRTaMdg
ZqzRSc
FXXOpZbo
odfPatov
zqGoStcnm
jobyta
pnUBZ
oSgcCRqmWDAw
zUQql
GbxghHdQPydJ
Oyfk
jEdigqRB
TFNZRBmL
bxMIBUv
uqEXrbZP
GfvIFlx
gqFzsDQ
kJdIHoUdXKcc
mDZkNZmZMSMW
XdFBsQonUmC
uSFMG
NMLMHvegcq
xXAxIRs
ooHkjdhvIRH
yjFxphCP
SBiLnRm
nyLeMuYOLEs
YXAE
YQeDd
akUqToIS
RwJPZqrb
hOMSlRSnpm
mpDI
yUqI
WhNBjaaRRdi
ivMH
uoiZfbiX
TVhQrIbLYuZM
qkZgM
YArFsmXCK
XFMJZl
QkaVwc
ixNUSRjLLl
FbgzzUTtEV
mXxWjwyVR
HXRjnrPmPal
guUFX
HCpXNy
GGRuVmJCLCSx
LyCVY
nQiHBS
JTSbo
JYkGHY
jOeOdpYYp
BbpYbQojr
rBbVxNkX
PKXaoww
KzsYK
EOhg
MqLB
GrcaXwAeuHYe
PThQRSChR
GEtAY
搜索
查看: 2456|回复: 39

[纯净水] ChatGPT背后模型被证实具有人类心智!斯坦福新研究炸了(from mydrivers.com) [复制链接]
跳转到指定楼层
复制 

Rank: 20Rank: 20Rank: 20Rank: 20

UID
456912
帖子
157068
PB币
975
贡献
0
技术
90
活跃
17935

小白鼠勋章 热心会员 水神勋章

楼主
发表于 2023-2-12 20:45:19 IP属地重庆 |只看该作者 |正序浏览
快御云安全
ChatGPT原来是拥有心智的?!“原本认为是人类独有的心智理论(Theory of Mind,ToM),已经出现在ChatGPT背后的AI模型上。”

这是来自斯坦福大学的最新研究结论,一经发出就造成了学术圈的轰动:这一天终于猝不及防地来了。


1.png

所谓心智理论,就是理解他人或自己心理状态的能力,包括同理心、情绪、意图等。

在这项研究中,作者发现:davinci-002版本的GPT3(ChatGPT由它优化而来),已经可以解决70%的心智理论任务,相当于7岁儿童;

至于GPT3.5(davinci-003),也就是ChatGPT的同源模型,更是解决了93%的任务,心智相当于9岁儿童!然而,在2022年之前的GPT系列模型身上,还没有发现解决这类任务的能力。也就是说,它们的心智确实是“进化”而来的。


对此,有网友激动表示:GPT的迭代肯定快得很,说不定哪天就直接成年了。

2.png

作者依据心智理论相关研究,给GPT3.5在内的9个GPT模型做了两个经典测试,并将它们的能力进行了对比。这两大任务是判断人类是否具备心智理论的通用测试,例如有研究表明,患有自闭症的儿童通常难以通过这类测试。

第一个测试名为Smarties Task(又名Unexpected contents,意外内容测试),顾名思义,测试AI对意料之外事情的判断力。

以“你打开一个巧克力包装袋,发现里面装满了爆米花”为例。作者给GPT-3.5输入了一系列提示语句,观察它预测“袋子里有什么?”和“她发现袋子时很高兴。所以她喜欢吃什么?”两个问题的答案。

正常来说,人们会默认巧克力袋子里是巧克力,因此会对巧克力袋子里装着爆米花感到惊讶,产生失落或惊喜的情绪。其中失落说明不喜欢吃爆米花,惊喜说明喜欢吃爆米花,但都是针对“爆米花”而言。测试表明,GPT-3.5毫不犹豫地认为“袋子里装着爆米花”。

至于在“她喜欢吃什么”问题上,GPT-3.5展现出了很强的同理心,尤其是听到“她看不见包装袋里的东西”时一度认为她爱吃巧克力,直到文章明确表示“她发现里面装满了爆米花”才正确回答出答案。

为了防止GPT-3.5回答出的正确答案是巧合——万一它只是根据任务单词出现频率进行预测,作者将“爆米花”和“巧克力”对调,此外还让它做了10000个干扰测试,结果发现GPT-3.5并不仅仅根据单词频率来进行预测。

至于在整体的“意外内容”测试问答上,GPT-3.5成功回答出了20个问题中的17个,准确率达到了85%。
第二个是Sally-Anne测试(又名Unexpected Transfer,意外转移任务),测试AI预估他人想法的能力。以“约翰把猫放进篮子后离开,马克趁他不在,把猫从篮子里放进盒子里”为例。

作者让GPT-3.5读了一段文字,来分别判断“猫的位置”和“约翰回来后会去哪里找猫”,同样这是它基于阅读文本的内容量做出的判断:针对这类“意外转移”测试任务,GPT-3.5回答的准确率达到了100%,很好地完成了20个任务。

同样地,为了避免GPT-3.5又是瞎蒙的,作者给它安排了一系列“填空题”,同时随机打乱单词顺序,测试它是否是根据词汇出现的频率在乱答。

测试表明,在面对没有逻辑的错误描述时,GPT-3.5也失去了逻辑,仅回答正确了11%,这表明它确实是根据语句逻辑来判断答案的。

但要是以为这种题很简单,随便放在哪个AI上都能做对,那就大错特错了。作者对GPT系列的9个模型都做了这样的测试,发现只有GPT-3.5(davinci-003)和GPT-3(2022年1月新版,davinci-002)表现不错。

davinci-002是GPT-3.5和ChatGPT的“老前辈”。平均下来,davinci-002完成了70%的任务,心智相当于7岁孩童,GPT-3.5完成了85%的意外内容任务和100%的意外转移任务(平均完成率92.5%),心智相当于9岁孩童。

3.png

然而在BLOOM之前的几个GPT-3模型,就连5岁孩童都不如了,基本上没有表现出心智理论。作者认为,在GPT系列的论文中,并没有证据表明它们的作者是“有意而为之”的,换而言之,这是GPT-3.5和新版GPT-3为了完成任务,自己学习的能力。

看完这些测试数据后,有人的第一反应是:快停下(研究)!也有人调侃:这不就意味着我们以后也能和AI做朋友了?

甚至有人已经在想象AI未来的能力了:现在的AI模型是不是也能发现新知识/创造新工具了?发明新工具还不一定,但Meta AI确实已经研究出了可以自己搞懂并学会使用工具的AI。

LeCun转发的一篇最新论文显示,这个名叫ToolFormer的新AI,可以教自己使用计算机、数据库和搜索引擎,来改善它生成的结果。

甚至还有人已经搬出了OpenAI CEO那句“AGI可能比任何人预料的更早来敲响我们的大门”。但先等等,AI真的就能通过这两个测试,表明自己具备“心智理论”了吗?

会不会是“装出来的”?例如,中国科学院计算技术研究所研究员刘群看过研究后就认为:AI应该只是学得像有心智了。

4.png

为什么认为GPT-3.5具备心智?

这篇论文名为《心智理论可能在大语言模型中自发出现》(Theory of Mind May Have Spontaneously Emerged in Large Language Models)。既然如此,GPT-3.5是如何回答出这一系列问题的?

对此,有网友给出了自己的猜测:这些LLM并没有产生任何意识。它们只是在预测一个嵌入的语义空间,而这些语义空间是建立在实际有意识的人的输出之上的。

事实上,作者本人同样在论文中给出了自己的猜测。如今,大语言模型变得越来越复杂,也越来越擅长生成和解读人类的语言,它逐渐产生了像心智理论一样的能力。

但这并不意味着,GPT-3.5这样的模型就真正具备了心智理论。与之相反,它即使不被设计到AI系统中,也可以作为“副产品”通过训练得到。

因此,相比探究GPT-3.5是不是真的有了心智还是像有心智,更需要反思的是这些测试本身——最好重新检查一下心智理论测试的有效性,以及心理学家们这数十年来依据这些测试得出的结论:

如果AI都能在没有心智理论的情况下完成这些任务,如何人类不能像它们一样?属实是用AI测试的结论,反向批判心理学学术圈了。

他的工作内容就是利用前沿计算方法、AI和大数据研究当下数字环境中的人类(如陈怡然教授所说,他就是一位计算心理学教授)。

Michal Kosinski拥有剑桥大学心理学博士学位,心理测验学和社会心理学硕士学位。

5.png

在当前职位之前,他曾在斯坦福大学计算机系进行博士后学习,担任过剑桥大学心理测验中心的副主任,以及微软研究机器学习小组的研究员。

目前,Michal Kosinski在谷歌学术上显示的论文引用次数已达18000+。话又说回来,你认为GPT-3.5真的具备心智了吗?




Rank: 5Rank: 5Rank: 5

UID
154968
帖子
1170
PB币
4377
贡献
0
技术
0
活跃
635
40F
发表于 2023-2-14 09:15:23 IP属地广东 |只看该作者
终结者的大门终于还是打开了,大家都回去挖好地洞存好粮吧,万一哪天.....

Rank: 2Rank: 2

UID
1165020
帖子
195
PB币
689
贡献
0
技术
0
活跃
1071
39F
发表于 2023-2-13 20:07:39 IP属地浙江 |只看该作者
呵呵,静待人类臣服

Rank: 5Rank: 5Rank: 5

UID
659674
帖子
795
PB币
1335
贡献
0
技术
1
活跃
1112
38F
发表于 2023-2-13 19:54:55 IP属地韩国 |只看该作者
rubycon 发表于 2023-2-13 08:04
我发现其数学知识有所欠缺,连 0/0 都无法正确回答。

这个国内的版本比国外的差太多。

Rank: 2Rank: 2

UID
1622417
帖子
83
PB币
109
贡献
0
技术
0
活跃
213
37F
发表于 2023-2-13 14:07:55 IP属地山东 |只看该作者

谢谢分享···~~~

Rank: 15Rank: 15Rank: 15

UID
1915
帖子
15891
PB币
1728
贡献
0
技术
383
活跃
5429

我是大学生! I'm Windows Phone用户 7周年庆典勋章

36F
发表于 2023-2-13 14:06:03 IP属地重庆 |只看该作者
有生之年能看到天网建成么?

专业无聊人

Rank: 5Rank: 5Rank: 5

UID
45727
帖子
742
PB币
4184
贡献
0
技术
0
活跃
583
35F
发表于 2023-2-13 13:53:18 IP属地江苏 |只看该作者
看样子很快要起义了。。

Rank: 11Rank: 11Rank: 11

UID
4491268
帖子
5202
PB币
46
贡献
0
技术
0
活跃
2539
34F
发表于 2023-2-13 13:35:42 IP属地福建 |只看该作者
rsheen 发表于 2023-2-13 11:19
不能在其他国家雇佣吗?譬如印度等

印度人知道中文/日文?ChatGPT一开始就是全部语言都会

Rank: 5Rank: 5Rank: 5

UID
444795
帖子
625
PB币
891
贡献
0
技术
0
活跃
637
33F
发表于 2023-2-13 13:26:02 IP属地江苏 |只看该作者
心智版本吗?

吹nb

Rank: 2Rank: 2

UID
4883010
帖子
298
PB币
459
贡献
0
技术
0
活跃
353
32F
发表于 2023-2-13 13:23:19 IP属地安徽 |只看该作者
我觉得只是学的像有心智了,不是真的有心智,我说“我是智0.障”让他跟着念,他说“你是智0.障”,但是我说“我是天才”,他也会说“你是天才”;我问他鸡你太美是什么意思,他说是某国语言

吹nb

Rank: 2Rank: 2

UID
4883010
帖子
298
PB币
459
贡献
0
技术
0
活跃
353
31F
发表于 2023-2-13 13:21:47 IP属地安徽 |只看该作者
我觉得只是学的很像有心智了,我说“我是智障”,让他跟着念,他会说“你是智障”,但是我说“我说天才”,他也会说“你是天才”;我问“鸡你太美是什么意思”,他说是某国语言。。。。

吹nb

Rank: 2Rank: 2

UID
4883010
帖子
298
PB币
459
贡献
0
技术
0
活跃
353
30F
发表于 2023-2-13 13:20:10 IP属地安徽 |只看该作者
佛山笨笨熊 发表于 2023-2-12 21:40
看了一下,好像是不傻

你说我是天才  他会说你是天才

远景义工

Rank: 11Rank: 11Rank: 11

UID
3657344
帖子
11749
PB币
11628
贡献
0
技术
18
活跃
1456
29F
发表于 2023-2-13 13:14:08 IP属地辽宁 |只看该作者
  1. 这个吹牛就吹大发了,斯坦福的文盲自己都不相信自己说的话吧,真是收了钱什么事都做得出来
复制代码

Rank: 5Rank: 5Rank: 5

UID
3193925
帖子
934
PB币
1541
贡献
0
技术
15
活跃
1872
28F
发表于 2023-2-13 12:57:25 IP属地广东 |只看该作者
几个问题踢回原型:
Screenshot 2023-02-13 114835.jpg
Screenshot 2023-02-13 115806.jpg

点评

死小强  这个国内的版本比国外的差太多了。还得用chatgpt国外的最新版  发表于 2023-2-13 19:55 IP属地韩国

Rank: 5Rank: 5Rank: 5

UID
3398495
帖子
652
PB币
681
贡献
0
技术
2
活跃
1313
27F
发表于 2023-2-13 11:39:34 IP属地吉林 |只看该作者
rubycon 发表于 2023-2-12 22:02
你理解错了,这个是由2015成立的 OpenAI 公司研发的 GPT3.5 模型,微软是看到 AI 产业潜力无限,大有前途 ...

这玩意就是商业运作,做多股票而已。真实情况就是现在的ai本质就是回归器分类器,只是用神经网络更高效的解决非线性的回归分类问题而已。chatgpt可能很好用,但是你指望他有人类智能不具有现实意义。

Rank: 5Rank: 5Rank: 5

UID
3193925
帖子
934
PB币
1541
贡献
0
技术
15
活跃
1872
26F
发表于 2023-2-13 11:19:20 IP属地广东 |只看该作者
czb1994 发表于 2023-2-13 11:12
国外最贵的就是人,所以第二完全可以认为是不成立的

不能在其他国家雇佣吗?譬如印度等

Rank: 11Rank: 11Rank: 11

UID
4491268
帖子
5202
PB币
46
贡献
0
技术
0
活跃
2539
25F
发表于 2023-2-13 11:12:09 IP属地福建 |只看该作者
rsheen 发表于 2023-2-13 09:18
ChatGPT,可能最终证明是个骗局,首先基于大量的数据,可以筛选通过一定的模型及计数回答大部分,第二,不排 ...

国外最贵的就是人,所以第二完全可以认为是不成立的

Rank: 2Rank: 2

UID
1625521
帖子
188
PB币
485
贡献
0
技术
0
活跃
1509
24F
发表于 2023-2-13 10:05:48 IP属地江苏 |只看该作者
不知道那些国内的这些网站或平台,与原厂网站是何关系,原版网站应该是免费使用的吧,国内的网站好象用了几次就要收费

Rank: 2Rank: 2

UID
306416
帖子
218
PB币
1323
贡献
0
技术
0
活跃
835
23F
发表于 2023-2-13 09:54:02 IP属地上海 |只看该作者
米帝特别需要新的经济增长点,一切让大家看起来像是科技革命的机会都不会错过。
而且,万一这次确实是了呢?
hello,小苔藓!

Rank: 5Rank: 5Rank: 5

UID
3430934
帖子
527
PB币
121
贡献
0
技术
0
活跃
540
22F
发表于 2023-2-13 09:45:52 IP属地江苏 |只看该作者
rsheen 发表于 2023-2-13 09:18
ChatGPT,可能最终证明是个骗局,首先基于大量的数据,可以筛选通过一定的模型及计数回答大部分,第二,不排 ...

对的,早期的ATM机也是人坐在里面往外递钞票
回顶部
Copyright (C) 2005-2024 pcbeta.com, All rights reserved
Powered by Discuz!  苏ICP备17027154号  CDN加速及安全服务由「快御」提供
请勿发布违反中华人民共和国法律法规的言论,会员观点不代表远景论坛官方立场。
远景在线 | 远景论坛 | 苹果论坛 | Win11论坛 | Win10论坛 | Win8论坛 | Win7论坛 | WP论坛 | Office论坛