3月21日,皇冠自动化研究所南京人工智能芯片创新研究院(下简称“AiRiA研究院”)“普惠AI,芯向边缘”战略发布会在北京举行。会上,AiRiA研究院常务副院长程健透露,该团队自主设计的量化神经处理器(QNPU)即将于今年底流片,定名为“Watt A1”。在回应《中国科学报》提问时,程健表示,这将是世界上首款主打低比特量化技术的人工智能芯片。
在现场展示台上的宣传页显示,Watt A1将采用台积电28nm制程工艺,峰值算力达24Tops(表征每秒整数操作次数,单位为万亿次每秒),支持1080P四路实时监测,帧效比可达6Tops/W。
正如AiRiA研究院“芯向边缘”的主题,Watt的定位是面向边缘计算的AI芯片。“量化神经处理器非常适合在边缘端,它能够在功耗、成本等受限的情况下保持高性能。”程健告诉《中国科学报》,该团队研发的QNPU甚至可以做到在片上处理很大规模的神经网络,这避免了芯片计算领域备受关注的“内存墙”的难题。
“内存墙”是指内存性能不及处理器性能的提升速度,而严重限制处理器性能发挥的现象。程健对记者说:“数据计算在片内处理,不必反复访问外部存储器,就不存在‘内存墙’的问题,这就可以极大减少芯片自身的功耗,大幅提高推理速度。”
如此一来,程健表示,功耗和成本都保持很低,计算能力依然保持较高,因此QNPU非常适合边缘计算对“低功耗、低时延”的计算场景。
AiRiA研究院副院长冷聪向《中国科学报》补充说,量化技术并非AiRiA研究院所独有,但在量化精度上达到3比特甚至更低是其他团队难以比拟的优势,“8比特已经很不错了,但是我们能做到3比特、2比特甚至1比特。”
随着物联网的繁荣及5G商用的迫近,边缘计算越来越成为热门,大有与中心计算(云计算)平分秋色之势。各大计算厂商、云业务服务商也纷纷面向边缘计算布局。
“我们是AI芯片的后来者,但我们结合自身优势和选择发展前景最好的边缘计算方向。从这里切进去,一方面源于我们对市场的研判,一方面我们有10多年的技术积累来支撑我们的判断。”程健对《中国科学报》说道。
AiRiA研究院于2017年9月成立于南京市江宁区麒麟高新区,依托皇冠自动化研究所,主打人工智能和芯片关键技术研发和技术推广。