CN

新闻中心

类脑芯片的商用梦

2022年02月08日

电子发烧友网报道(文/周凯扬)“抛弃冯诺依曼架构”,“模仿人类大脑计算”,近年来,这些噱头为类脑芯片吸引了不少人的注意。他们相中了这类“非传统”芯片在AI上的潜力,毕竟将AI计算做到大规模和低功耗还是一件不小壮举。因此类脑芯片被诸多低功耗边缘应用看好,而传统的密集型云端计算的重任仍然担在传统的AI芯片的肩上。


无论是Fabless,还是IDM,不少大厂其实都在关注边缘AI的市场,比如英特尔的Movidius和英伟达的Jetson等等。但市面上也有一些厂家在发力类脑芯片的开发,同时探索新架构的芯片上将用到怎样的软件开发生态。因为这些类脑芯片往往用到的是脉冲神经网络(SNN),直接拿常用的卷积神经网络(CNN)或人工神经网络(ANN)硬套的话,是万万行不通的。也正是因为软硬件上的双重挑战,限制了类脑芯片的商用。




英特尔的类脑芯片已经研究了近5年之久了,早在2017年英特尔就发布了基于14nm制程的Loihi芯片,该芯片具备13万个神经元,1.3亿个神经突触。2021年英特尔又公布了Loihi的继任者Loihi 2,该芯片基于更名后的Intel 4制程,将芯片大小从60mm2缩小至31mm2,却依然集成了百万个神经元和1.2亿神经突触。


Loihi 2类脑芯片 / 英特尔

虽然这些Loihi芯片都具备可观的规模,但类脑芯片并没有走向HPC的高性能之路,而是继续坚持低功耗的优势,这一点从英特尔在评估Loihi时进行的应用展示也可以看出。英特尔称在三年多的研究中,他们尝试的应用有自适应机器臂控制、学习与识别新的气味与手势、比视觉输入延迟更低的无人机电机控制,以及解决铁路调度等优化问题。在这些应用中,与传统CPU加GPU方案动辄几百瓦的功耗相比,Loihi的功耗甚至不到1W,可以做到mW级的功耗和ms级响应时间。


当然了,单靠类脑芯片的硬件是远远不够的,类脑芯片商业化进展缓慢的一大原因就是缺乏清晰高效的编程模型,为此英特尔开发了一个开源类脑计算框架Lava。Lava不仅支持离线训练,还可以集成TensorFlow、PyTorch和ROS这样的第三方框架,开发者可以自行对其进行扩展。


Oheo Gulch板卡 / 英特尔


不过英特尔的Intel 4制程还未正式面世,目前只准备了两种Loihi 2硬件供研究人员远程线上测试,一个是用于早期评估的单片系统Oheo Gulch,另一个则是尚未面世的8芯片系统Kapoho Point。


英特尔的类脑芯片尚处于发展初期阶段,即便是第二代Loihi目前也仅仅只是研究芯片,并没有一个定下来的商用路线。反观其他的大厂,IBM的TrueNorth芯片已经多年没有动静,而三星的类脑芯片虽然已经宣布可量产,但还没有任何成品或设计面世。反倒是一家名不见经传的公司,BrainChip,最先开启了类脑芯片的商业化道路。


Akida类脑处理器 / BrainChip


去年10月BrainChip发布了两款开发套件,分别是用于x86的Shuttle PC套件和用于Arm树莓派的套件,两个套件均采用了BrainChip的类脑芯片 AKD1000。AKD1000类脑芯片基于BrainChip 的Akida IP和台积电28nm制程,却做到了120万个神经元和100亿的神经突触的规模,功耗范围在微瓦级到毫瓦级。BrainChip也为Akida处理器准备了MetaTF这一开发环境,支持利用Python编程语言和Jupyter notebooks、Numpy这样的开发工具和库,轻易将CNN转换成SNN。


除了PCIe和Mini-PCIe的开发套件外,Akida也开始在汽车市场露面了。在今年CES梅赛德斯奔驰展示的Vision EQXX概念车中,其语音控制系统就用到了BrainChip的Akida类脑芯片。根据梅赛德斯奔驰的声明,Akida类脑芯片为其语音控制系统中的关键词检测提供了更低的功耗,与传统的语音控制方案相比效率提升了5到10倍。从BrainChip的急速商业化来看,类脑芯片并不一定要像英特尔的Loihi一样用上先进制程,也能做到优秀的性能。






不少高校同样开展了类脑芯片的研究,其中之一就是浙江大学。2015年和2019年,浙江大学分别推出了第一代和第二代达尔文类脑计算芯片,其联合之江实验室也在2020年成功研制出当时神经元规模最大的类脑计算机Darwin Mouse。该计算机内部包含792颗达尔文2代类脑芯片,共1.2亿神经元,近千亿神经突触,功耗范围在350W到500W范围内,由此计算达尔文2代类脑芯片的单片规模为15万神经元和1.2亿神经突触左右。


这792颗芯片采用了每四颗芯片组成一块板子,再由多块板子组成模块打造类脑计算机,由此可见的达尔文2代类脑计算芯片的扩展性。为了完成神经元的高效互联和调用,其科研人员还开发了面向该计算机的类脑操作系统DarwinOS,并基于该计算机和操作系统完成了多种智能任务,比如多个抗洪抢险机器人的协同、基于脑电信号的“意念打字”和音乐诗词的时序记忆等。


不过这样的类脑计算机体积依然是一个问题,在792颗芯片的拼装下,这台计算机占据了3个1.6米高的机柜,如何进一步减小芯片体积都是实现边缘AI计算最急迫的问题。而且达尔文芯片的规模还有提升的空间,Darwin Mouse类脑计算机的神经元和突触规模看似很大,与生物大脑相比也就只有小鼠大脑的规模,离人类的大脑规模还有很大的差距。虽然可以牺牲体积,但这与边缘AI的愿景就有些背道而驰了。



从目前的应用市场来看,类脑芯片尚处于一个研究发展阶段,还存在软硬件开发不成熟的问题。虽然已经有了大厂入局,但目前连量产都不成熟,应用方向上也在探索传统AI芯片走过的老路。固然类脑芯片的前景值得期待,至于大规模商用,仍是一个比较遥远的梦。