在近日的openai开发者大会上,openai创始人sam altman带来了团队最新的成果gpt-4 turbo,同步在chatgpt和api版本推出。据悉,这款最新大模型在长文本、知识库、多模态、模型控制、模型微调、高速率六大方面的功能均进行了提升,而价格甚至比gpt-4还要低。
sam altman透露道:“今天,有大约200万开发者使用我们的api进行开发,超过92%的财富500强公司使用我们的产品,而chatgpt的每周活跃用户大约有1亿。”
人工智能正不断颠覆我们的生活,
世界范围内,大模型也如
“雨后春笋”般涌现。
不过,在使用中,人们发现:
大模型还有一些缺陷
有待攻克:
无法进行“逆向思考”,
常识性问题存在缺陷
……
在2023世界顶尖科学家智能科学大会上,复旦大学教授邱锡鹏表示:“很多人认为大型语言模型是一个工程性的问题,但我们这边可以呈现的是,大型语言模型还有很多科学性的挑战或者科学性的问题。”
大型语言模型存在科学挑战
“人工智能,或者说自然语言处理,在过去的五年,实现了巨大的进展。”邱锡鹏谈道。
不过,在使用中,人们发现,不少对于人类思维来说易如反掌的问题,对大模型来说,却依然无法攻克,其中就包括逆向问题:“大型语言模型并不能预测一个逆向的关系,如果这个语言模型已经建构了a to b的关系,它并不能够逆向预测b到a的关系。”
长文本处理也同样是个难题,“现在,大型语言模型是高度复杂的,我们希望大型语言模型能够处理上千甚至上百万的输入文本。”邱锡鹏说道,当前的大型语言模型无法处理超长的文本输入,如果我们要进一步给大型语言模型扩容,我们必须要建立一种新的架构,这个是我们面临的第一个挑战。”
另一方面,大模型“一本正经地胡说八道”的情况,也不在少数,大型语言模型会产生无意义或者不正确的结果,邱锡鹏对此给出一个思路:“如果想让大型语言模型减少幻觉现象,我们必须要将更多的负面的反馈‘喂’给大型语言模型,这样有助于大型语言模型的学习,他们可以学习到这些案例。”
除了这些在使用中比较常见的问题外,邱锡鹏同时也谈到了目前大模型在变得更好的过程中,存在的科学挑战。例如“思维链”——将复杂的问题化解为多个较简单的问题,这是一个非常有用的概念。“这样我们可以通过一个链式的结构来逐一解决它们。怎么样让大型语言模型具备这种能力呢?这也是我们需要解决的挑战。”
期待ai能够帮助人类
实现更高维度的数据处理
对于ai for science,邱锡鹏充满希望:“我觉得人工智能的技术,特别对于大型语言模型驱动的人工智能,对于科学研究来说是非常重要的一个工具。”
“
我们要在人工智能工具
以及科研方面要找到一个平衡,
让ai成为你的朋友。
邱锡鹏谈道,当前研究工作许多都是针对非常复杂、非常难的问题,“比如说就像大部分人无法想象3d以外的世界,或者更高维度的世界。现在很多的科研当中,我们都要处理高维度的数据。”但是,又无法直接获得超高维度的数据,只能进行投影,把它投影到二维或者三维,然后继续来处理。
“我相信人工智能的技术
能够帮助我们,
能够在非常复杂的数据当中
找到更多的相关性。”
不过邱锡鹏也表示,在当前阶段,对于作为科研工具使用的人工智能,科学家应该清楚地认识到其能力边界:“我觉得我们应该知道这些人工智能工具的能力边界,用合适的方法来利用人工智能。”
openai发布的gpt-4 turbo,
是否能够在上述问题上有所突破?
尚有待使用者们的验证。
ai的征途,还在远方。
“上海科技”出品,转载请注明来源
企业及专家观点不代表官方立场
↓分享
↓点赞
↓在看
上观号作者:上海科技