GPT-4变得更精确的要求时批评本身,新的报告说

广告

尽管暂停6个月人工智能发展的可能性,GPT-4潜在重大进步和自我反省的使用技术称为“反射”。

这种技术允许GPT-4评价自己的表现,批评其答案和重写解决方案基于结果。研究人员已经使用这种技术来改善GPT-4的性能在不同的测试。

“这不是每天,人类开发新技术来实现最先进的标准使用决策过程一度被认为是人类独有的智慧,”研究人员写道诺亚希恩和Ashwin Gopinath。“但是,这正是我们所做的。”

在HumanEval测试,哪些特性164 Python编程GPT-4从未见过的问题,它的分数与反射技术从67%上升到88%。同样,在Alfworld测试,测试GPT-4做出决策的能力和解决多步任务在交互式环境中,它的分数从73%提高到97%,只有失败的134年的任务。

在HotPotQA测试,包括解析内容和推理几个支持文档,GPT-4最初精度34%。然而,使用反射技术,其精度提高至54%,表现优于原来的分数。

越来越多地使用人工智能AI问题正在解决。这种方法生成的对抗网络(GAN)方法,两个AIs协作来提高彼此的能力。

例如,一个人工智能生成图像很难区分真正的的,而另一个试图区分真实和假的图像。然而,在这种情况下,GPT作为作家和编辑,努力增强自己的输出。

反射技术已经被证明是有效地改善GPT-4的性能在不同的测试,证明其潜在重大发展人工智能的发展。

广告

留下一个回复

你的电子邮件地址将不会被发表。必填字段标记*