芯东西(公众号:aichip001)
作者 | 翊含
编辑 | Panken
芯东西3月30日消息,美国南加州大学、马萨诸塞大学、麻省理工学院等高校的多位华人学者研发了一款基于忆阻器的新型AI芯片,通过设计一种对忆阻器“降噪”的方法,实现了更高的电导等级。这项研究进展有助于提高边缘设备上AI计算的算力和能效。
该团队将由一家商业晶圆代工厂生产的256 × 256忆阻器阵列单片集成在CMOS电路上,在完全集成芯片中实现了2048个可区分的电导等级,这比此前研究的电导等级高出一个数量级。
相关论文在3月29日发表于国际顶级学术期刊Nature。论文题目为《集成在CMOS上的忆阻器有数千个电导等级》(Thousands of conductance levels in memristors integrated on CMOS)。
展开全文
论文链接:
一、将硅与金属氧化物结合起来制造芯片,低能耗也能支撑起强大功能
他们在Nature上的新论文专注于对基本物理学的理解,导致人工智能硬件内存容量的需求急剧增加。杨建华教授领导的团队与南加州大学(包括Han Wang的团队)、麻省理工学院和马萨诸塞大学的研究人员一起,开发了一种用于设备降低“噪声”的协议,并演示了在集成芯片中使用该协议的实用性。
这个演示是在TetraMem进行的。TetraMem是一家由杨建华教授和他的合著者(Miao Hu、Qiangfei Xia和Glenn Ge)共同创立的初创公司,旨在将人工智能加速技术商业化。
▲使用C-AFM直接观察去噪过程中传导通道的演变(图源:Nature)
在过去大约30年里,虽然人工智能和数据科学应用所需的神经网络规模每3.5个月翻一番,但处理它们所需的硬件能力每3.5年才翻一番。各国政府、工业界和学术界都在努力应对这一项全球性的硬件挑战。一部分人继续致力于使用硅芯片的硬件解决方案,而另一部分人则在试验新型材料和设备。
杨建华教授的工作属于中间阶段,专注于开发和结合新材料和传统硅技术的优势,以支持重型人工智能和数据科学计算。杨建华教授和他的同事正在制造的芯片将硅与金属氧化物忆阻器结合起来,以创造功能强大但能耗低的芯片。该技术的重点是使用原子的位置来代表信息,而不是电子的数量(这是目前芯片计算中涉及的技术)。原子的位置提供了一种紧凑而稳定的方式,以模拟而不是数字方式存储更多的信息。
▲用于神经形态计算的高精度记忆器(图源:Nature)
此外,信息可以在其存储的地方被处理,而不是被送到少数几个专门的“处理器”之一,这一处理方式消除了目前计算系统中存在的所谓“冯·诺依曼瓶颈”。杨建华教授说,通过这种方式,人工智能的计算“更节能、吞吐量更高”。
据杨建华教授介绍,这种新型存储芯片在目前已知的所有类型的存储技术中具有最高的单器件信息密度(11位)。这种小巧但功能强大的设备可以发挥关键作用,为端侧设备的性能提供支撑。这些芯片不仅用于内存,还用于处理器。数以百万计的新型存储芯片芯片在一个小芯片中并行工作以快速运行人工智能任务,只需要一个小电池就可以为其供电。
二、芯片依赖原子存储记忆,小规模设备也能运行ChatGPT
在传统芯片中被操纵的电子是“轻”的,这种轻度使它们容易四处移动,更不稳定。杨建华教授和合作者不是通过电子存储内存,而是将内存存储在完整原子中,所以这种内存很重要。
杨建华教授说,当关闭计算机时,有价值的信息内存会随之消失,而这是一件非常浪费时间和精力的事情。
这种新的信息内存存储方法专注于激活原子而不是电子,不需要电池电量来维持存储的信息。类似的情况也发生在人工智能计算中,其中能够实现高信息密度的稳定内存至关重要。杨建华教授设想这项新技术可以在边缘设备中实现强大的人工智能功能,比如谷歌眼镜,他说谷歌眼镜之前经常出现充电问题。
▲不完全传导通道中俘获电荷诱导电导的变化(图源:Nature)
这种将芯片转换为依赖原子而不是电子的方法,使得芯片变得更小。杨建华教授补充道,有了这种新方法,在更小的规模上有了更多的计算能力。他说,这种方法可以提供“更多层次的内存以帮助提高信息密度”。
现在ChatGPT是在云端运行的。新的创新,再加上一些进一步的发展,可以把迷你版的ChatGPT的能力引入每个人的个人设备上。它可以使这种高功率的技术更加实惠,并可用于各种应用。
结语:突破硬件瓶颈,新芯片设计提供最高硬件内存
南加州大学电气与计算机工程教授杨建华与合作者为边缘人工智能开发了一种基于忆阻器的新型人工智能存储芯片。这种芯片通过原子存储内存的新方法,可以实现人工智能计算的更高吞吐量和更高能效。
这种新型存储芯片在目前已知的所有类型的存储技术中具有最高的单器件信息密度(11位),使得小巧但功能强大的设备可以发挥关键作用,为端侧设备的性能提供支撑。
来源:美国南加州大学维特比工程学院、Nature