■ 本报记者 薛蕾
作为一家深耕高可靠对话云技术研发的高新技术企业,成都它思科技有限公司(以下简称“它思科技”)专注于利用先进的大模型技术攻克行业难题,包括消除幻觉内容、解决数据稀缺问题以及提高模型训练效率,并致力于实现国产化算力配置,以促进企业在人工智能领域的稳健发展。
依托清华大学语音与智能实验室(THU-SPMI)的深厚研究成果,它思科技拥有一流的语音与语言处理技术,涵盖人机对话系统、语音识别与理解、自然语言处理等多个前沿领域。
近年来,它思科技积极推动半监督式AI的发展,旨在突破当前AI技术对高昂标注成本的依赖。通过高效利用有限的标注数据和大量的未标注数据,显著提升数据转化为智能的效率。随着人工智能技术的不断演进,智能化已成为各行各业转型升级的关键驱动力。它思科技凭借其卓越的技术实力和创新能力,在多个领域取得了显著成就。
近日,金融投资报记者采访了它思科技首席执行官赵贤宇与首席技术官聂玮奇,对它思科技的核心技术和产品进行了深入地探讨。
高可靠性、高效性和国产化
金融投资报记者:它思科技主要做什么?核心目的是什么?
赵贤宇:它思科技的核心产品是高可靠对话云平台,旨在通过大模型技术的应用,解决当前人工智能领域的核心难题:一是减少模型生成内容中的不实信息(即“幻觉”);二是应对垂直领域高质量数据稀缺的挑战;三是降低对国外硬件的依赖,实现算力配置的国产化。通过攻克这些难题,我们的产品具备了高可靠性、高效益和国产化的特点。
金融投资报记者:能否详细描述一下高可靠对话云的具体解决方案和技术特点?
赵贤宇:它思科技即将发布的TasiChat人机对话产品,通过“检索增强生成”(RAG)和引用溯源技术,在大模型生成的内容中明确地标记出哪些部分的信息来自知识库中的文档,用户可以更好地评估生成内容的可信度和准确性,增强生成内容的可靠性。
金融投资报记者:我们注意到,它思科技的数字人技术与大模型是紧密结合的,这方面有哪些特色?
赵贤宇:大模型与数字人的技术相结合,是一个全新的方向,它不仅要求我们在大模型方面有深厚的技术积累,还需要在语音降噪、语音识别(ASR)、语音合成(TTS)、人机对话管理等方面具备综合能力。一方面,通过集成大模型,显著提高了传统的人机对话系统的智能化水平;另一方面,利用先进的语音技术,确保数字人在各种声学环境下准确地理解用户的指令,流畅地与用户进行交互。
消除AI的幻觉很重要
金融投资报记者:AI的幻觉问题目前在业内的说法不一,您如何看待幻觉?
赵贤宇:AI的幻觉指的是模型产生不准确或无根据的回答。我们认为,确保信息的准确性至关重要,因此致力于解决这一问题。虽然有些研究者认为幻觉也有其价值,比如激发创造力,但在实际应用场景中,任何企业都不会忽视幻觉问题,因为这直接影响到产品的可信度和用户体验。我们在成立之初就把解决幻觉问题当作头号问题,目前是业内在解决幻觉问题上投入最多的企业。
金融投资报记者:如何降低模型的幻觉,这是否需要高质量的标注数据?
赵贤宇:我们采用了“检索增强生成”(RAG)技术。该技术能够根据知识库中的信息生成可靠的答案,降低了编造答案的可能性,从而降低了模型的幻觉。在这个过程中,我们确实需要一定量的标注数据对检索、生成等环节进行优化。
金融投资报记者:不过,高质量数据是有限的,如何解决数据稀疏的问题?在数据不完整的情况下,半监督式学习如何发挥作用?
赵贤宇:确实是这样的,获取高质量的数据,尤其是高质量的标注数据,代价是非常高昂的,因此,我们关注的重点就是要提高数据的利用效率。为了解决标注数据稀疏的问题,我们引入了“半监督学习”技术,这种方法允许模型利用少量标注数据进行训练,并通过自举、迭代的方式提高模型能力、扩展知识边界,通过这种方法降低数据标注的成本,提高数据利用率。
金融投资报记者:半监督式学习技术能为公司带来哪些正面效益?
赵贤宇:通过半监督式学习技术,能够显著提升数据的利用效率,这意味着无需对所有数据进行标注就能达到良好的训练效果,从而降低了成本。
得益于这项技术,针对中国移动的一个应用场景,我们利用少量的标注数据,成功地将对话的成功率提高到了91%以上,达到了业界领先的水平。
新技术的商业化潜力
金融投资报记者:目前它思科技的主要客户群体有哪些?产品主要是面向C端还是B端?
聂玮奇:我们的主要客户群体B端和C端用户都有包括。对于B端客户,倾向于与那些对模型生成内容的准确性有较高要求的企业合作,例如需要高质量客户服务的公司和需要撰写精确文档的企业。对于C端用户,主要面向需要进行简单文本撰写的人群,如撰写专业文档和学术论文的个人用户。产品既面向B端也面向C端,但在早期阶段更侧重于与B端客户合作,通过提供技术支持来共同推进项目成功并分享收益。对于C端客户,公司正在探索商业化路径,并计划推出包含高级功能的会员服务,预计就在今年8月份,我们会上线TasiChat1.0版本。
金融投资报记者:您认为影响新技术的商业化进程的因素有哪些?
聂玮奇:商业化潜力的评估主要包括两方面:一是公众对该技术的认知度,即技术是否被广泛接受和认可;二是该技术能否有效解决用户的实际痛点,特别是在不同行业中的关键性问题。
例如,在文档撰写中,我们需要确保所采用的技术不仅能提高写作速度,还能生成可靠可信的内容。我们的方案通过提供来源可追溯的服务来增强用户对其生成内容的信任度。比如,当用户看到引用自真实新闻或自身资料的高质量语句时,他们会更加放心地使用,并进一步探究相关知识。此外,AI还可减少遣词造句的时间,实现双向促进,推动整个业务流程向前发展。
只有你的技术解决了痛点,市场才会认可你的技术;只有当市场对技术持开放态度并且愿意尝试时,技术才能更容易商业化。
金融投资报记者:它思科技是如何根据不同行业客户需求制定解决方案并深化合作关系的?
聂玮奇:我们采取与长期合作伙伴深度绑定的方式,深入了解客户的实际需求和痛点,共同寻找业务和数据上的契合点,针对性地解决问题,提高收益。
比如,在智慧医疗领域,我们基于大数据进行智能导诊和分流,帮助医院更高效地管理病人流量;在智慧文旅行业中,我们开发了一款能够解决客服热线压力的人工智能助手,使望远镜制造商的客服人员接待效率提高了80%,从而有效降低了人工成本。此外,我们还在文化和旅游领域为博物馆开发了数字人讲解系统,方便游客互动学习。