首页 - 百科 > 华科大发布AI大模型猴子

华科大发布AI大模型猴子

发布时间:2024-07-11 06:40:18 阅读:744

华科大发布AI大模型猴子

image.png

12月12日消息,华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型“Monkey”。

该模型擅长图像描述和视觉问答,能够实现对世界的“观察”,对图片进行深入问答交流和精确描述。

官方介绍称,在18个数据集上的实验中,华科大Monkey模型表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、谷歌的PALM-E、阿里的Mplug-owl等。

此外,Monkey在文本密集的问答任务中显示出显著的优势,甚至在某些样本上超越了业界公认的领先者GPT-4V。

Monkey的一个显著特点是其出色的“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。

另一亮点是能够处理分辨率高达1344 x 896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍。

据悉,目前业内能处理的图片最大分辨率为448×448像素。

值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。

马斯克的AI聊天机器人Grok出现“幻觉”

12 月 12 日消息,近日,埃隆・马斯克旗下 AI 公司 xAI 推出了全新的人工智能聊天机器人 Grok,并面向美国地区的 Premium+ X 用户开放。据官方介绍,Grok 采用了名为 Grok-1 的模型,与目前 OpenAI 旗下 ChatGPT 所使用的 GPT-4 模型完全不同。值得一提的是,Grok 还整合了 X 平台的实时数据,能够根据 X 平台的最新动态提供实时回应,这也是其与其他竞争对手的显著差异之一。

然而,就像所有 AI 聊天机器人一样,Grok 也存在“幻觉”问题,即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型(LLM)中都普遍存在,包括 ChatGPT。

近日,一个 Grok 尴尬的“幻觉”在社交媒体上引起热议。有用户在使用 Grok 时收到回应称:“我无法完成您的请求,因为它违反了 OpenAI 的用例政策。”

xAI 工程师 Igor Babuschkin 对此解释道,Grok 在训练过程中使用了大量网络数据,很可能在其中包含由 OpenAI 生成的文本,导致出现了这样的“幻觉”,他称:“不过请放心,这个问题非常罕见,我们已经意识到了它,并将确保未来的 Grok 版本不会出现类似的问题。请放心,Grok 的开发没有使用任何 OpenAI 代码。”

如何避免类似事件的发生,以及如何让 AI 聊天机器人更安全、更可信,将是未来 AI 研发的重要课题。


版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件举报,一经查实,本站将立刻删除。

标签: #马斯克 #幻觉

华科大发布AI大模型猴子相关文章