DeepSeek成功背后的功臣之一:追一科技RoPE技术

2025-03-10   追一科技

春节前后,全球科技创新的顶流当属DeepSeek,它以低成本、高性能的特性引领了第二个“ChatGPT时刻”,甚至在普及大众对AGI认知的影响力上更胜一筹。外媒也感慨,这是人工智能领域的“一场地震”“一座里程碑”。

从技术原理上来说,Deepseek的成功,尤其是最新一代DeepSeek R1的成功,除了来自于它所采用的RL强化学习策略外,还采用了追一科技提出的旋转位置编码(RoPE)技术,以达到极低成本却可以实现和GPT-4o差不多效果的目的。

DeepSeek对RoPE的引用

传统的位置编码方法(如绝对位置编码或相对位置编码)在处理长文本时存在局限性,例如难以有效捕捉远距离依赖关系或计算复杂度较高。而RoPE通过引入“旋转矩阵”对向量进行位置变换,在保持相对位置关系的同时,也成为了目前长文本能力建模多个方案的基础,并降低了计算开销,比如PI、NTK、Yarn等。 该技术由追一科技在2021年提出,知名的技术极客组织EleutherAI认为RoPE是“革命性”的,具有开创式意义。

Google PaLM的论文中表明RoPE的有效性

值得一提的是,RoPE这一技术除了被DeepSeek引用外,诸多国内外对标ChatGPT的大模型也采用了RoPE,如Meta的LLaMA,Google的PaLM、阿里的Qwen、智谱的GLM等。RoPE技术相继被大型语言模型所采用,证明了它的优秀效果。正如DeepSeek通过算法创新突破算力限制一样,中国的AI企业向世界证明:中国AI企业不仅能实现技术自主,更能定义技术标准。

作为一家以技术驱动的AI企业,从深度学习到大模型时代,追一科技始终坚信,底层技术的突破是AI发展的核心驱动力,未来,追一科技将持续不断的引领创新突破,为智能时代的加速到来贡献力量。