首页头条 > 正文

DeepSeek也有“AI幻觉”? 四川企业寻求解法

金融投资报 2025-02-07 20:30:29
| |
全球人工智能技术迅猛发展,然而大模型普遍存在的“AI幻觉”问题影响其准确性及可靠性。中国科学院秦小林教授指出,DeepSeek虽有显著功能提升,但逻辑推理能力尚待改善,仍未解决幻觉问题。四川企业积极探索与DeepSeek的合作,以期降低该问题的发生,特别是在数学和专业领域中的应用。多家公司如它思科技和明途科技正在投入资源解决幻觉问题,四川地区对DeepSeek的应用热情高涨。

金融投资报记者 薛蕾

当前,全球人工智能技术发展迅速,大模型成为行业关注重点。但大模型普遍存在的“AI幻觉”问题,影响其准确性和可靠性。

中国科学院成都计算机应用研究所副总工程师,研究员、中国科学院大学教授、博士生导师秦小林在接受金融投资报记者采访时表示,DeepSeek大模型功能固然相较以前有大幅提升,但其逻辑推理能力有待提升,幻觉问题仍未解决。

金融投资报记者注意到,面对“AI幻觉”难题以及探索大模型更广泛应用场景的需求,四川企业并未仅仅满足于引入DeepSeek,而是凭借敏锐的行业洞察力,主动深入挖掘。尤其是“AI幻觉”这一难题,四川多家企业积极行动,与DeepSeek深度融合,在不同领域与DeepSeek开展合作,DeepSeek的四川朋友圈不断扩大。

图片

制图:卿子秀

这些川企致力解决大模型幻觉问题

AI幻觉,指的是模型产生不准确或无根据的回答。

秦小林举例称,他向DeepSeek提问了初中数学中三角函数的问题,但并未收到正确回答。

图片

秦教授向DeepSeek提问的数学问题

“其实还是需要理性地看待DeepSeek。我给R1一个有点难度的几何题,DeepSeek、豆包都相去甚远,ChatGPT的回答稍微有点像那么回事,但仍然没有给出正确的结果。”秦小林告诉金融投资报记者:“大多数时候是给一个差不多的答案,然后自圆其说。还有一些简单的问题,大模型也喜欢将简单的问题复杂化,不过会给解题人一些思路,这一点倒是比较有意思。”

在秦小林看来,目前的大模型仍未解决“AI幻觉”问题,DeepSeek对已有知识的能力的确进步神速,但机器的逻辑推理能力仍有不少的路要走。

不止数学问题,不少用户在使用DeepSeek的过程中发现,它在回答专业问题时经常存在幻觉。例如给它一首歌让其分析音乐风格并对其进行深度解析,DeepSeek生成的内容看上去十分专业,但实际上仍有不少专业性错误。

金融投资报记者观察发现,AI幻觉的问题在于,AI会生成大量专业词汇,当它生成的内容超出用户学科认知的时候,其信息量之大,让用户很难一一核对,无法辨别真假。

图片

用户使用DeepSeek时收到的错误回答 受访者供图

针对解决AI幻觉问题,金融投资报记者了解到,成都它思科技有限公司(以下简称:它思科技)在成立之初就把解决幻觉问题当作头号问题,是业内目前在解决幻觉问题上投入相对较多的企业。

它思科技CEO赵贤宇此前接受金融投资报记者采访时表示,它思科技采用了“检索增强生成”(RAG)技术。该技术能够根据知识库中的信息生成可靠的答案,降低了编造答案的可能性,从而降低了模型的幻觉。

“DeepSeek是它思科技常用的底座大模型之一,DeepSeek的强化学习思路和我们半监督学习从本质上是类似的,只不过具体实操有些区别,可以做到类似的效果。”它思科技首席技术官聂玮奇向金融投资报记者表示。

据悉,它思科技目前在文旅场景有一些新的产品尝试,但具体实验成果目前还在保密阶段。在解决AI幻觉上它思科技是否有更新的技术进展?金融投资报记者将持续关注。

此外,成都明途科技有限公司(以下简称:明途科技)在解决大模型幻觉方面也有布局。明途科技董事长肖雪松表示,明途的私有数据价值发掘、决策智能和群体智能正好可以帮助DeepSeek解决通用模型的幻觉问题,帮助其在B端和G端实现商业化落地,尤其是明途的决策智能,正是DeepSeek推理能力的下一步延伸方向。

DeepSeek四川朋友圈持续扩容

值得一提的是,四川企业在拥抱DeepSeek方面展现出极高的热情与行动力,不断融入其朋友圈。

算力领域,四川华鲲振宇智能科技有限责任公司目前已经适配DeepSeek V3、R1、R2模型,并免费提供48小时DeepSeek基于昇腾算力任测服务,2月10日起,用户可免费申领DeepSeek API接口。

芯片领域同样积极响应。成都华微2月6日在互动平台表示,DeepSeek的推出使得大模型的部署计算算力需求大幅降低,一方面是模型训练成本降低,另一方面为大模型在边缘和端侧的部署提供更有力的支撑,使得AI端侧大规模商用落地进度大幅提前。公司致力于边缘和端侧人工智能处理器开发,也在积极推进在处理器开发上进行DeepSeek推理模型部署,打造智能联合体在智能机器人、机器狗等方向的应用,提供从算法到软件到算力芯片的端到端解决方案。

医药领域也不甘落后,四川合纵药易购医药股份有限公司2月7日宣布全面部署DeepSeek大模型,用于医药智能供应链、新零售赋能、精准医疗等场景。其部署标志着医药大健康产业生态的数字化升级,旨在从“经验驱动”转向“数据智能驱动”模式。

AIGC应用服务商成都数据天空科技有限公司也上线DeepSeek,其人工智能开放平台目前已上线了包括DeepSeek在内的近60个AI模型,通过数据天空的AI云盒接入,用户可以低成本实现对比模型对比应用。

目前,四川各行各业在DeepSeek的应用与推动上,正通过技术创新、产业融合、模式探索等多种方式多点开花。


AI推荐
金融投资报© 版权所有 未经书面授权 不得复制或建立镜像
蜀ICP备12002292号  互联网新闻信息服务许可证51120180008  网络出版服务许可证(川)字第059号  公众监督电话:028-86968465

川公网安备 51010402001419号