采访|谷丰
编辑|小麦
在一场技术浪潮滚滚向前的时代里,江琦始终站在风口,但他从不盲目逐风。
作为有云数智的联合创始人兼董事长,他选择了一条看似不那么“耀眼”的路径——不造基础大模型,不拼通用能力,而是专注做一个“拼图者”,用智能体把AI从象牙塔带入真实世界。
在与央国企的复杂交付中,他带领600多名技术人员,将碎片化的数据“拔出来、洗出来、切出来”,炒成能喂给AI的“好菜”。江琦说,这不是技术炫技,而是用“懂业务”的AI,真真正正解决问题。
时代面孔总编辑谷丰,对话有云数智联合创始人兼董事长江琦,聊聊他为何坚持走一条“务实而深耕”的技术创业之路。
谷丰:“有云数智”未来的发展方向,主要是人工智能,跟DeepSeek 有什么差别?
江琦:我们本身是不做通用大模型的,我们自己的产品生态,还是基于人工智能的三要素——算法、算力和数据来提供的。我们其实是结合这些大模型厂商,作为它的合作方,然后把一些生产的应用、具体的 AI 应用场景,用人工智能的方式,以智能体的形式,去进行交付。
我觉得这是两个不同的方面, DeepSeek 为代表的、通用的基础大模型厂商,可以理解为它们是行业的基石,在他们的基础之上,底层又需要有算力和数据,提供大家的语义,提供大家的教材。所以其实是一个相辅相成、相互促进的产业生态。
谷丰:您的智能体主要在哪些行业应用?
江琦:我们主要还是针对于央国企的市场,一种是在能源、电力领域的一些生产应用,比如主控室这样一些智能诊断和专家系统,比如具体生产线上的智能分拣和数据检修的工作。
第二个,面向我们央国企用户的话,通用的话还是办公需求,我们是想通过智能体的方式,提供除了 OA 系统审批流之外额外的一些智能功能,比如 AI 写作、智能检索,包括对外的宣讲、直播等等,都可以通过智能体的方式实现。
所以其实智能体最终是人机交互的一个生产结果,对我们而言的话,是希望能够通过这种松耦合、模块化的方式,比如说现在大家需要智能体是通过 DeepSeek 来生成的,那我们底层可以DeepSeek,然后去训练一些行业智能体大模型。
谷丰:更符合工业的应用场景。
江琦:对,而且越是标准化,越是模块化,越是轻量级不被感知。这个就跟当年的云计算,从一个人人关注的重点技术,突然变成了大家习以为常的基础设施一样,它越是不被感知,就表明它越成熟,说明它真正的被各行各业接纳和使用了。
谷丰:就跟 DeepSeek一样,我们天天感知它,说明它应用还不够广泛。
江琦:对,但是到了明年这个时候,如果大家不再这么热烈地讨论 DeepSeek本身 了,而是讨论 AI 在具体生产场景、生活场景中的应用时,那说明 DeepSeek 已经变成了像自来水一样的基础设施了,其实说明那个时候它已经很成熟了。
谷丰:基础大模型、应用大模型,它是两个不同的赛道。 AI 加我们的行业智能体上,中美之间的差距有没有?
江琦:我觉得美国在原始创新、基础能力上,给我们做了一个很好的示范,但是中国有很强的技术创新和跟踪能力。但是如果从 AI 的应用场景上来说,也就是迭代创新和AI 应用上,那我觉得一定是中国能力更强,因为我们有广泛的产业基础,有庞大的创新创业者。
另外还有一个很重要的原因就是,不管是从国家政策,还是从民众对于新技术、新应用的接受程度而言,中国人对新技术的拥抱度是要比美国更高的,更愿意去使用新技术,更接受新技术影响我的生活。
其实我们一直是在亲历着整个技术和行业的发展。在这个过程中的话,其实对我们有个很大的挑战,就是你得拥抱变化,因为它的迭代速度在过去,比如说在早期的 IOE 时代, EMC 做存储,或者说 IBM 的大机、小机,只要形成了一个技术壁垒,这个技术壁垒可以形成十年甚至数十年的技术优势。但现在,从技术兴起到产业成熟到被替代的周期已经越来越短了,可能 1 ~ 2 年就是一个新的技术迭代。
谷丰:这个行业是很苦的一个行业,怎么坚持下来的呢?
江琦:还是要有对技术的好奇心和对产业的热爱。其实中国的软件从业者是有全世界最强的工作强度的,因为我们面对着最复杂的用户需求和最激烈的、同质化的行业竞争,那么在这个过程中,你会需要在理想化、产品化、标准化和客户定制化、项目制之间不断平衡。这其实是中国创业者普遍的一个需求,就是既要做一个理想主义者,同时又要做一个企业的经营者。
谷丰:从同方有云变成了有云数智,为什么这么变呢?
江琦:这里面有两个产业定位。第一个是我们随着同方计算机,进入到了软通动力产业生态,从硬到软,整个集团能力的大的生态赋能。第二点的话,就是随着我们“云、数、智”这三个板块的业务展开,我们在数据和人工智能领域的占比和能力已经越来越成熟,我们希望对外界传递一个更清晰的市场定位,希望更强化我们“数”和“智”的能力和大家对我们的认知。
谷丰:这个投资的过程是重还是轻?
江琦:其实在中国的信息化行业,软硬件结合它是一个常态,软件是最容易做技术创新和应用结合的,但硬件它其实是你的基础,它是最容易做标准化和整体交付的。在中国市场,特别是你要进行大客户,它更多是以国央企为主,而很多国央企它其实就代表着一个行业,那在这个过程之中的话,它更适合私有化的交付。但是一旦私有化交付就会受到算力的制约、数据质量的制约。我们做的工作其实就是通过对 AI 算力架构的能力,去进行私有化、去部署。
通过这样提高数据质量的方式,去降低大模型的幻觉,因为即使像 DeepSeek这样领先的,在私有化环境里,也会受到语料的制约,那怎样能和业务场景相结合,不断地对它进行微调和训练?怎么把用户场景里这么多年的纸质化、碎片化的数据,把它矢量化,形成语料喂给它?在这个过程中,其实有很多工作要做。
我们试过各种算法调优、算力加速,希望去提高 AI 的认知度。但我们最后发现,最直接的方式还是提高语料的质量,数据质量直接决定着 AI 的幻觉的程度。
谷丰:从哪能拿到那么好的数据?
江琦:我们认为通用大模型,它其实就是人类文化这么多年沉淀的结果,但是最终它在某个行业里面的应用其实就是私域的、被外界不可获取的,这部分的话其实就类似于我们这些 AI 服务商,去替客户把这些数据和它的行业应用和智能体相结合。所以我们要做大量的算力架构实施和数据治理的工作,最终把这个数据变成沉淀下来的知识,变成大模型能够听得懂、学得会的数据。
谷丰:喂它一些比较好的料。料好的话结果就会很好。
江琦:对,很多语料它是好的料,但它可能还是长在田里的菜。你需要把它拔出来、洗出来、切出来、炒成菜,然后喂给它吃。
谷丰:把它分类处理,什么样的数据喂给什么样的平台?
江琦:是的,包括它需要哪些具体的元数据的标记,它需要有哪些语义?需要哪些关键量?这个是需要去懂它的业务去定义的。
谷丰:您最早创业的时候不是做这个行业的。为什么突然进入人工智能这个赛道呢?
江琦:其实我是学核的,大学的专业是热能与动力工程,创业的初衷是因为我们赶上了一个好的时代,不管是资本的兴起,还是技术的革新,当时我们有很好的机会可以去从事一些新的工作,所以这是时代给我们的一个机会,我们的初衷是希望利用这个好的历史时代的机遇,做一点自己觉得有价值的事情。
谷丰:在创业的过程当中有没有至暗时刻?
江琦:有的。早期的时候,凭借着理想主义和对技术的热衷,确实赶上了一个好的时代。但是一旦资本浪潮褪去,特别是在 2016 年到 2018 年,资本热度下降之后,很容易就看出来谁在“裸泳”,在这个过程中其实挺考验大家的经营能力的。
谷丰:公司科研人员有多少?销售人员有多少?
江琦:软件开发人员已经有 600 多人了。基础设施、平台开发团队,大概是80几个人,也是我们最核心的一个团队。
谷丰:你怎么评价自己的?是个市场官、技术官,还是个企业家?
江琦:我觉得我在有云数智,其实做的是资源整合的工作,在每一个方面我都不是整个公司能力最强的,但是我要做的工作就是把大家整合在一起,为一个整体的目标去进行长期主义的坚持。最终我们希望,我们提供的解决方案,能帮客户真的解决了一些问题,提高了一点点效率,这个其实就是我们的价值。