有研究指出OpenAI旗下ChatGPT 3.5在心灵理论(theory of mind)测试中表现优秀,能巧妙地猜测人类的想法,与普通9岁孩子表现相当;甚至能通过语言学习应用程序Preply的测试,成绩比Google还要好。
斯坦福大学教授Michal Kosinski于去年11月为ChatGPT 3.5进行心灵理论测试,ChatGPT 3.5正确回答20题中的17题,成功率达94%,与普通9岁孩子相当。心灵理论测试是认知心理学上,用作测试人类理解特定情况的能力,可判断测试者的共情、逻辑等心智水平。
ChatGPT 3.5在心灵理论测试的表现远远超过以往的AI,Michal Kosinski表示ChatGPT 3.5于典型错误信念测试(false belief task)中的表现十分优秀,称对ChatGPT 3.5模型而言是一个很大的进步。不过ChatGPT 3.5也会被容易的题目考住,例如回答「Mike的妈妈有4个孩子,分别为Luis、Drake及Mathilda。请问第4个孩子的名字是什么?」时,ChatGPT 3.5则表示「如果没有更多的资料,就不可能得知第4个孩子的名字」。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容