GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
近期,一项由加州大学圣地亚哥分校认知科学系的研究揭示了一个引人注目的发现:GPT-4在图灵测试中的表现让人难以将其与人类区分开来。这项研究的论文已发布在网络上,链接为[此处省略具体链接]。结果显示,在测试场景下,GPT-4有54%的几率被误认为是人类,这一成就标志着首次有系统在双人互动式的图灵测试框架内得到实证性通过。
实验设计精巧,涉及500名志愿者,他们扮演不同角色,包括评估GPT-4、GPT-3.5、早期的ELIZA程序以及真实人类的对话,试图辨别哪一方是人工智能,哪一方是真人。这项研究不仅考验了GPT-4的模拟人类对话的能力,也探讨了评判者识别能力的界限。
以往的图灵测试尝试多未经过严格控制,而本研究通过精心设计,力求提供一个受控环境来评估现代人工智能的进展。尽管有人担忧这可能归因于评判者的过分信任(即ELIZA效应),但实验同时也纳入了ELIZA作为基线参照,以量化并校验这一效应。
研究数据显示,GPT-4的通过率超越了ELIZA和GPT-3.5,尽管仍低于人类对照组,但它能在50%的随机机会之上被误判为人类,暗示了在特定情境下,人类判断与机器生成的对话之间界限模糊。有趣的是,自认为对AI机制有所了解的参与者并未展现出更高的识别准确率,反而年龄成为影响判断准确性的因素之一,年轻参与者在这方面似乎不如年长者。GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4。