英飞凌选择 RRAM 的背后——新型存储器市场崛起之路39
近日,英飞凌和台积电宣布,两家公司正准备将非易失性存储器 ( NVM ) RRAM ( ReRAM ) 引入英飞凌的下一代 AURIX 微控制器 ( MCU ) ,并将在台积电的 28 纳米节点上制造。 英飞凌选择 RRAM 而不是嵌入式闪存(eFlash)的背后有其考量:在新型存储器中,RRAM 不仅满足高读写速度和存储密度的要求,同时延迟可降低 1000 倍,可满足未来智能驾驶高实时数据吞吐量。安全性方面,RRAM 具备可靠性,未来有望出现高性能、高集成度、高稳定性和低功耗的车规 RRAM 存储器。英飞凌汽车微控制器总经理 Thomas Boehm 说:"RRAM 为性能扩展、功耗降低和成本改善创造了巨大潜力。" 这不是英飞凌第一次尝试新型存储器。今年 7 月,英特尔透露将逐步停下自有 Optane 存储器业务。Optane 是相变存储器 ( PCM ) 的一种变体,基于英特尔与美光联合研发的 3D Xpoint 技术。 这到底是器件或者技术本身导致的注定失败,还是新型存储器在崛起之路上的一段尝试?eeNews 在其文章《为何新型存储器尚未成功》中倾向于后者 : " 正如我们在新报告《新兴存储器进入下一阶段》中所解释的那样,越来越多的公司使用的 CMOS 代工逻辑无法将 NOR 闪存嵌入到小于 28nm 的工艺中,除非 NOR 是使用 28nm 或更大的工艺技术生产的。换句话说,芯片的逻辑部分会随着工艺的缩小而继续缩小,但 NOR 的尺寸会保持不变,这将大大减缓芯片成本的降低。SRAM 似乎也是如此。在大约 10nm 的工艺中,SRAM 的扩展速度比逻辑慢得多,尽管它并没有像 NOR 那样完全停止。" 传统存储器所具有的易失性、微缩性差等问题可以被新型非易失性存储器很好地解决。而新型存储器如何打开市场,《中国电子商情》11 月刊中的《供需混沌,迭代如常,存储器迎来怎样的 2023》一文认为:" 新技术要有市场,关键在于能否解决应用的计算和内存瓶颈。" 突破传统架构,RRAM(ReRAM)存算一体有望提升计算系统能效比 开发新计算系统源于几点:数据指数增长、功耗增加,当前计算系统的性能限制也是原因之一。对此,业界提出 " 近内存 " 或存内计算(In-memory Computing),以解决数据中心的几个问题,包括数据传输 " 存储墙 "(Memory barrier)、高功耗和时间成本。涉及深度学习网络的数据中心需要巨大的计算能量,要求高可靠性、更出色容量、带宽和性能的存储器,从而衍生出关于新的非冯 · 诺依曼系统的新兴存储技术研究。 普遍认为,RRAM(也即 ReRAM,阻变式随机存取存储器)、PCM(相变随机存取存储器)和 MRAM(磁随机存取存储器)等新型存储器是下一代存储技术路线,这些也是 " 存内计算 " 的基础技术,从技术特征来看,这些技术有哪些独特性? 资深电子器件专家 Ray 表示,上述的下一代非易失性存储器首先是作为存储级内存被提出的,在存储层级中介于内存和硬盘之间,因此,存储的性能指标对这些下一代非易失性存储器仍然适用,如面积、功耗、读写速度、集成性、成本等。此外,下一代非易失性存储器也非常适用于存内计算,而存内计算又对这些存储器提出了新的要求,如开关比、多阻态、鲁棒性等。RRAM、PCM 和 MRAM 等是目前研究较多的下一代非易失性存储器,它们各有优势和不足。 MRAM 中的磁性材料磁化方向变化的时候,从磁性材料两端电极上读取得到的隧穿电流会发生变化,从而得到不同电阻,其编写速度快、重复编写周期长,但其材料制备较复杂、开关比较低、易受扰动。 PCM 是利用相变材料在焦耳热作用下,在结晶态和非晶态之间转换,从而呈现出不同阻态,其已经在英特尔等公司的产品中使用,大规模集成性较好,但其写入速度较慢、写入能耗较大。 RRAM 主要依靠绝缘层在电场作用下,通过离子的迁移形成导电细丝,再通过控制导电细丝的通断控制阻态,综合来看在各个指标上均具有比较优异的性质,其结构简单、存储密度高且支持片上 3D 集成、开关比可达 1000 以上、读写速度和功耗适中,且其可通过控制导电细丝的形态形成多阻态,从而模仿生物大脑中神经突触功能,适合存内计算和类脑计算。 目前 RRAM 作为新兴存储器,其规模化制备的良率、成本、外围控制电路等还需进一步优化,同时,我们也很欣喜地看到国内和国际的多家制造厂商已经布局 RRAM 的制备,并且已完成晶圆级 RRAM 芯片的流片。 在 RRAM 商业化之前,还需要解决哪些难题?Ray 说道,同其他研究一样,RRAM 的科研主要解决科学问题,在进行商业化的时候还有很多工程问题需要解决,包括大规模制造、架构和软件的配合、应用场景等,但目前来看,其很多科学问题已经经过了大量的研究,取得了很多突破,这些技术问题相信随着时间的推移也将逐步解决。 物联网和网络边缘的人工智能(AI)和机器学习(ML)快速增长,这些应用端的计算系统的能效比的问题日益突出,而 RRAM 作为一种较佳的解决方案,成为研究的焦点。 Ray 进一步说道,目前的计算架构采用冯诺伊曼架构,其存储与计算单元分离,因此,在 AI 等计算应用中,大量数据需要不断在片下的内存和片上的计算单元之间搬运,然而由于内存带宽不足带来的 " 存储墙 " 问题,导致计算延时和能耗较高,难以满足 AI 模型的算力和功耗需求。存算一体技术将存储单元与计算单元融合,在存储器内利用物理定律进行计算,避免了 " 存储墙 " 问题,极大地降低了数据搬运的能耗和延时,并提升了计算的能效比。基于 RRAM 的存算一体目前是国内外的研究热点和前沿,其主要实现方式分为两种,即模拟式存算一体和数字式存算一体。 模拟式存算一体利用了 RRAM 的模拟式阻态特性,通过电导存储多比特数据。以神经网络中应用较广泛的矩阵乘积运算为例,其电导值存储神经网络的权值,输入为电压值,利用欧姆定律完成乘法,得到电流值,然后阵列中同一条数据线上的电流根据基尔霍夫电流定律相加,从而完成乘加运算。模拟式存算一体可以达到较高的存储密度,但其对环境噪声和温度较敏感,运算精度较低,主要适合低精度、小算力的应用场景。 而数字式存算一体中,其每个 RRAM 只存储一比特数据,经过乘法运算得到电流后再经过数字电路进行后续加法等运算,此种方法虽然存储密度低于模拟式存算一体,但其优势是在保证计算能效比的前提下,支持高精度、大算力的运算,提高计算的鲁棒性,从而极大地拓展了存算一体的应用场景。 相比于 CMOS 器件,目前 RRAM 的局限性主要体现在编写周期有限上,因此目前 RRAM 主要适用于 AI 推理等操作,而相信随着工艺的演进,得到更高编写周期的 RRAM 也是非常有希望的。另一个局限性是 RRAM 阻值的波动性,而此问题在数字化存算一体中可以得到很好的解决。 矽说在《存算一体是大势所趋还是审美疲劳?》一文中提到,在即将召开的 ISSCC 2023 上,存算一体相关的论文至少有 21 篇,占了整个 ISSCC 录用论文的 10%。而从技术路径来分类,纯模拟的存算一体在 session 7 (SRAM 存算一体 Macro)中只有 2 篇,其余均是数字。数字化技术将成为 " 存算一体 " 的大趋势。 紧跟趋势,国内初创公司勇闯 " 无人区 "? 提到 RRAM 和数字化存算一体,就不得不提一下日渐名声鹊起的一家国内企业——亿铸科技。根据其官网描述,自 2020 年成立以来,就专注于 " 基于 ReRAM 的全数字化存算一体 AI 大算力芯片 " 的研发。放眼全球,这种结合与尝试都是非常新的,但是这种组合否能助力新型存储器市场崛起、甚至在国产化 AI 大算力芯片上取得亮眼成绩,还需时间去验证。好在这个未来并不远——亿铸科技曾透露,其第一代芯片将于 2023 年落地,并于同年投片第二代芯片。且让我们拭目以待。 |