90后北大校友芯片创业,获千万级融资,能跑大模型推理

寒序科技希望成为第一个在磁性计算领域完成商业闭环的公司。

作者 |  程茜

编辑 |  Panken

芯东西 5 月 23 日报道,今日,北大系磁性计算芯片创企寒序科技宣布完成千万级融资,由彼岸时代、源合资本投资。

成立于 2023 年 8 月的寒序科技,孵化于国内磁学研究重要高地北京大学应用磁学中心,至今已经完成三轮融资。其 20 余人的团队中,大多为 90 后且拥有多学科交叉背景。

这家创企的联合创始人是朱欣岳。他告诉芯东西,寒序科技希望成为第一个在磁性计算领域完成商业闭环的公司。

目前,寒序科技针对 AI 需求,探索磁性存算一体技术,研制适用于大模型推理的超高带宽磁性逻辑计算芯片,推出 SpinPU-E 系列芯片;针对高性能计算需求,探索量子启发的经典计算,研制高比特数全连接磁性概率计算芯片,推出 SpinPU-M 系列芯片。

在产品层面,他透露,寒序科技针对大模型推理的 E 系列芯片已经于今年 2 月进行第一次流片的投片,并将于明年推出面向端侧和云侧的磁性计算芯片产品。

朱欣岳提到的磁性计算,可分为磁概率计算和磁逻辑计算。寒序科技是目前国内唯一在磁性计算这两个领域均有布局的公司。

如今,寒序科技依托于磁性隧道结(MTJ)和随机磁性隧道结(sMTJ)等新型磁电子学器件,结合存算一体与 Chiplet 技术,为 AI 推理算力和专用算力两个领域,设计并推出了高性能、低成本、开发友好的 SpinPU 磁性计算芯片。

▲寒序科技 SpinPU-M01 概率计算加速卡(图源:寒序科技)

磁概率计算芯片与其他 AI 芯片的主要区别是,不采用传统逻辑运算或不同存储计算方式,而是利用磁性材料的特性,通过对磁状态的操控和读取来进行概率计算。在存算一体架构的磁概率计算芯片中,磁性随机存储器可直接在存储单元内进行部分计算操作,其优势在于能耗低、并行计算能力强、对复杂概率模型处理效率高,短板则为技术成熟度相对较低、与现有技术生态融合存在挑战等。

兼具非易失性、高速读写、超低功耗、集成度高优势的磁计算芯片,已成为全球半导体巨头英特尔、三星、台积电、SK 海力士等押注的下一代潜力芯片技术。

朱欣岳告诉芯东西,寒序科技已经通过底层工艺、芯片设计、软件算法进行联合优化,能够基于国内工艺打造磁计算芯片,这正是寒序科技的核心优势之一。

在高性能大算力芯片需求激增的背景下,这家成立不到两年的创企将如何从日趋激烈的芯片混战中突围?近日,寒序科技联合创始人兼 CEO 朱欣岳与芯东西进行了一场深入对谈,将创业历程中的思考、选择以及对技术发展与商业落地趋势的研判悉数道来。

▲寒序科技联合创始人兼 CEO 朱欣岳

01.

北大、清华曾抛来橄榄枝

90 后组团创业

寒序科技团队年轻、多学科交叉背景的特征在朱欣岳身上体现的淋漓尽致。

北京大学物理学院硕士毕业的朱欣岳,本科就读于南京邮电大学,拥有电子科学与技术、计算机科学与技术的双重专业背景,曾在加州大学伯克利分校进行跨模态人工智能领域的暑期科研。本科时,他曾带领团队斩获各大创新创业比赛的全国奖项,开展 AI 音乐和量子精密测量两个方向的科研工作。

本科即将毕业之际,北京大学凝聚态物理所硕士以及中央音乐学院和清华大学计算机系联合培养博士均向他抛来了橄榄枝。由于电子工程与计算机科学的交叉背景和高中物理竞赛的经历,他希望做更加接近世界本质的物理研究,并面向 AI 的计算需求研发物理本征的计算设备。

最后他选择了凝聚态物理学科中的磁学与自旋电子学,到国内磁学重镇北京大学应用磁学中心攻读硕士学位,师从杨金波教授、罗昭初研究员。他基于磁学与机器学习的深层关联,提出磁性计算、物理本征计算的新方案,研究方向涉及新型自旋电子学工艺与器件,以及神经形态计算、类脑计算、概率计算、近存计算等新型计算方案。

在 2021 年 10 月尚未入学北大之际,他就已经与导师罗昭初围绕磁学相关的产业化方向展开了讨论与探索。他认为," 磁性计算 " 是他们这样一支立足北大磁学高地,又深耕 AI 算法和集成电路设计的团队最具有优势的方向。他希望做第一个完成磁性计算芯片商业闭环的公司。

他深入理解磁学的实验物理、器件和工艺后,找到了能有效落地的磁性芯片技术方案。

目前国内磁存储、磁传感等领域的市场竞争已经愈发激烈,有北航等高校的多年攻关和全国重点实验室支撑,还有希磁、灿瑞等大型企业具有规模和技术优势,致使初创企业很难快速占领有利生态位。

基于嵌入式新型磁器件的计算芯片设计道路则更符合他想快速商业落地的目标。他认为这条赛道目前已经被台积电、三星、SK 海力士等半导体大厂押注并验证,同时能基于国内磁性工业基础快速在 2~3 年内快速实现量产。

▲磁电子学自旋电子学(图源:寒序科技)

这一创业想法在 2022 年底 ChatGPT 发布之际被加速,他们开始寻找新型磁性计算芯片在云端算力上的机会点。

2023 年 5 月,朱欣岳开始正式筹备磁性计算的创业方案,这也是北大磁学在信息技术领域唯一的产业化项目。三个月后,寒序科技在北京正式成立,寒序科技还与澳门大学模拟与混合信号超大规模集成电路国家重点实验室进行集成电路设计合作。

多学科交叉背景,是朱欣岳寻找人才的准则之一。目前寒序科技共有 20 余人,大多为 90 后,他们的学科涉及底层物理、材料、器件工艺,以及芯片设计、芯片制造、AI 算法等多个领域。

这个团队中,朱欣岳统管技术、产品、运营,他的导师罗昭初负责前瞻性技术判断、战略布局。团队的优势包括,不仅能超预期完成工程技术研发、产品规划,且相比于学术出身的创业团队对于产业、行业有着更为前沿、超预期的认知。

寒序科技联合创始人兼首席科学家,北京大学物理学院助理教授、研究员、博士生导师罗昭初是国内磁学领域的知名学者。他在清华大学材料学院获得学士和博士学位,并分别在材料学顶级期刊 Advanced Materials、Advanced Functional Materials 发布两篇论文。

02.

低能耗、速度快、体积小是天然优势

两大产品系列明年推出

寒序科技已经形成两大产品系列,分别是针对 AI 需求的超高带宽磁性逻辑计算芯片 SpinPU-E 系列芯片;针对特定需求的高比特数全连接磁性概率计算芯片 SpinPU-M 系列芯片。

▲寒序科技的产品矩阵(图源:寒序科技)

这家创企的 M 系列芯片对标的是北美量子计算创企 D-Wave。D-Wave 专注用超导量子比特实现量子计算机。

在量子计算标准问题 Max-Cut 求解测试中,SpinPU-M01 与 D-Wave 最新一代产品相比,速度均在秒级以下,求解规模更优。且寒序科技的 SpinPU-M01 芯片大规模流片量产后,单片造价数千元人民币,性能可对标 D-Wave 最新产品。

▲寒序科技与 D-Wave 产品性能对比(图源:寒序科技)

创业初期,朱欣岳基于学术和产业认知的判断是:云端推理需求、端侧模型部署需求会激增。2024 年初,寒序科技就已针对 Llama、Qwen、DeepSeek 等开源模型进行了更底层的垂直适配。

磁性计算芯片具备的低能耗、速度快、体积小的底层优势,与这两大领域相契合。

质量、电荷和自旋,是标识电子特性最为重要的三个物理量,传统芯片以电子的电荷作为信息载体,信息通过电流传导。然而,电子的另一个自由度——自旋则几乎被忽略了。

电子电荷在电路中流动会因电阻产生热量,导致能量损耗。随着芯片集成度提高,热损耗问题愈发严重。而电子自旋主要通过改变自旋状态来传递和处理信息,不依赖电子的大量定向移动,理论上能耗更低,且其翻转速度极快,理论上可以在亚纳秒甚至皮秒级的时间尺度内完成,这使得基于电子自旋的信息处理有望实现更高的频率和更快的运算速度。

▲电子自旋原理(图源:寒序科技)

从最底层物理材料、芯片设计到上层软件算法进行联合优化,磁计算芯片可以实现更低功耗和更快运算速度。相比于同样拥有功耗、速率优势的光芯片,磁计算芯片还能做到更小的体积和更高的硅基兼容性。

同时,微纳磁器件直接沉积到硅基晶体管之上,在后道工艺的上层金属做磁性隧道结,单元级互联实现超高密度,从计算架构上做到超高访存带宽,相比于 HBM 有更大带宽优势。而高带宽就意味着更快的推理速度,寒序科技计划将首词元延迟(TTFT,Time to First Token)和词元生成速度(TPS,Tokens Per Second)做到极致,比英伟达快 5 倍 ~10 倍,做 " 最快 " 的推理芯片。

从产业角度看,存算分离架构中数据需在存储端与计算端之间频繁传输,难以跨越传统冯 · 诺依曼架构带来的 " 存储墙 " 和 " 功耗墙 "。寒序科技基于存算一体架构的磁性芯片则利用微纳磁性器件与独有的磁性芯片设计手段,推出超高带宽、更快推理速度的 SpinPU-E 系列磁逻辑计算芯片。

在基于先进存储的高性能推理芯片架构上,寒序科技对标的是时下两家知名 AI 芯片创企 Groq 和 Cerebras。他们采用的路线均为 SRAM 存算一体,但因其器件体积较大、集成密度低、芯片容量小,导致用于云计算推理时成本较高。

SRAM 存储单元由六个晶体管组成,单位面积芯片上存储的容量或者能承载的模型权重较为有限,且 SRAM 的性能提升很大程度上要依赖于工艺节点下降,国内的工艺现状意味着这条路面临诸多瓶颈。

03.

主攻 AI 药物研发

参与智算中心建设、大模型适配

在商业化落地层面,寒序科技的 M 系列概率计算芯片瞄准了 AI 制药、航天、水利电力领域,选择标准是:哪个赛道能快速验证产品性能,就在哪个赛道做标杆客户。E 系列的逻辑计算芯片则直接面向智算中心、大模型企业与互联网大厂的推理需求,展开产品适配与市场拓展。

凭借与学术界紧密的技术联结优势,以及具备与行业头部企业协同开展工业级测试的能力,AI 制药领域成为寒序科技的第一个性能验证场景。

SpinPU-E 系列磁逻辑计算芯片为 Transformer 架构定制设计,可兼容国内 28nm 硅基工艺,采用存算一体的磁计算范式,提高带宽并降低成本。应用方面适用于主流 AI 模型的端侧部署,直接面向 AI 大模型及边缘推理市场,应用场景包括智能硬件、具身智能、自动驾驶、AI PC 等。

SpinPU-M-01 实现了 1024 比特数、1023 连接度、16 位宽精度,朱欣岳透露,下一代芯片他们保守会做到 4096 比特数、4095 连接度、16~32 位宽精度。

▲寒序科技 SpinPU-M-01 性能(图源:寒序科技)

对于未来的产品迭代规划,其会在可控成本下进行工程实现,追求计算速度的极限,同时让 M 系列做到软件侧尽量开源、硬件侧尽量稳定,目前其第一代产品仍在优化过程中。

在芯片研发之外,寒序科技还会参与智算中心建设、异构计算适配、前沿大模型适配等。朱欣岳提到,这是因为他们提供的加速卡和服务器的标准、具体产品形态和交易结构会随着市场变化而变化,因此寒序科技会将后期产品化以及算法适配的工作前置,注重产业生态站位以及与下游客户的绑定,以便动态调整终端产品形态和交付方式。

04.

结语:跳出主流硅基芯片

磁性芯片在推理、边缘侧找到落地场景

当下,大模型的发展对如何让算力更好用、易用提出更高要求,寒序科技在传统硅基芯片之外,选择了一条以 CMOS 兼容的新型磁性芯片路径,并依托其低能耗、速度快、体积小的天然优势,在 AI 推理、边缘端模型部署中找到了有效落地场景。

成立不到两年,有着多学科交叉背景的寒序科技团队,将北京大学这一国内磁学研究高地在学术研究上的进展,与国内工艺基础相协同,在产品层面已经初见成效。寒序科技 SpinPU-M 系列芯片正在与客户进行联合调试,其面向云侧和边缘侧的芯片都将于明年推出。

未来,这种依托于磁性器件特性的磁概率计算和磁逻辑计算芯片未来如何在实际应用中有效落地并发挥价值,还需拭目以待。