开源生态里,每一行代码都是创新的火种;协同创新中,每一个企业都是生态的支点。近日,全球知名开源平台抱抱脸公司等多个团队已宣布复现了DeepSeek—R1的训练过程。
通过底层架构创新降低AGI成本,同时以开源策略构建生态护城河,DeepSeek提供了中小型机构突破算力限制的可行路径。
“DeepSeek出圈,很好地证明了我们的竞争优势:通过有限资源的极致高效利用,实现以少胜多。中国与美国在AI领域的差距正在缩小。”面壁智能首席科学家刘知远说。
使命:“探索未知之境”
一直以来,驱动DeepSeek的目标并非利润而是使命。正如其公司之名深度求索,“探索未至之境”既是这帮中国本土年轻科技工作者的愿景,也是他们雄心。
“中国也要逐步成为贡献者。”梁文锋说,“我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件,Scaling Law(规模定律)也在被如此对待。但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,中国必然需要有人站到技术的前沿。”
“我们创新缺少的不是资本,而是信心,以及组织高密度人才的能力。”梁文锋说。
从技术到愿景,DeepSeek坚定选择的始终是一条难且正确的路。这也是为什么,即便别国在人工智能领域已坐享先发优势,后发者依然有机会凭借技术创新、成本优化打破大模型竞争的传统逻辑,打破人工智能行业竞争格局,打破“他国更擅长从0到1的原始创新,而中国更擅长从1到10的应用创新”的成见,重塑竞争优势的奥秘。
随着AI浪潮的袭来,中国科技工作者一直在追梦。“追”不仅仅是“跟”,目的在“超”。不仅是DeepSeek的科研团队,还有更多的科技工作者推动原始创新和颠覆性创新,脚踏实地潜心研究关键核心技术,以科技创新锻造新质生产力。
1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。发布会上,科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题以及高中奥赛题的表现。讯飞星火X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。
“一直以来,讯飞星火坚持走全国产化路线。”科大讯飞相关负责人对记者说,“尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题。”
其他中国公司在其大模型性能方面也取得巨大进步。2024年底,阿里巴巴和腾讯投资的创业公司月之暗面表示,自己开发了一个专门研究数学的模型,性能接近海外头部大模型。月之暗面创始人杨植麟说:“公司专注于强化学习,也就是模仿人类的试错过程。这种方法或许能够在提升模型性能的同时不需要那么多的算力。”
2024年12月,字节跳动的豆包系列多款大模型选择在上海首发,涉及视觉理解、3D生成等领域。“豆包视觉理解模型能精准识别视觉内容,且具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。”火山引擎总裁谭待说。首次亮相的还有豆包3D生成模型。如同一套支持AIGC(人工智能生成内容)创作的物理世界仿真模拟器,该模型与云服务平台火山引擎的数字孪生平台结合使用,可以完成智能训练、数据合成和数字资产制作。
近年来,中国AI技术人才的创业信心也在不断提高。国家互联网信息办公室近期发布的信息显示,截至2024年12月31日,共有302款生成式人工智能服务在国家网信办完成备案,其中2024年新增238款备案。
根据《2024年度人才迁徙报告》,AI相关岗位需求在2024年激增,算法工程师、大模型算法等职位位列热招榜前20。技术岗位平均月薪前十名中,大模型相关岗位占据半数。
“热爱、扎实的基础能力,是我们招人的标准。”梁文锋说,自己在招聘时会挑选并培养几乎没什么工作经验的中国顶尖大学应届毕业生,“创新需要信心,而年轻人往往更有信心。”
应用:“全家齐玩AI”
近日,广东省深圳市龙岗区在区政务外网成功部署上线了DeepSeek—R1全尺寸模型(含6710亿参数),并于2月11日在龙岗区“龙i企”企业服务小程序正式上线DeepSeek AI助手功能,为企业提供更加智能、便捷的政务办理、在线咨询、政策解读等高效智能政务服务。
据悉,“龙i企”接入DeepSeek AI助手功能后,依托海量的政府政策资讯以及政务办理信息,运用先进的自然语言处理和机器学习技术,为企业用户打造了全方位、智能化的服务体系。企业用户只需登录“龙i企”小程序端,在首页点击“龙i企AI助手”,即可便捷体验各类贴心的企业服务。