第48章苏清颜的科研突破(1 / 4)

年度总结会后的第二天,林默就把MA-4的架构预研提上了日程。

MA-4的目标很明确:算力达到MA-3的三倍,功耗不增加,成本控制在MA-3的1.5倍以内。这意味着能效比要提升一倍——在半导体工艺不变的情况下,这几乎是不可能完成的任务。

“除非换架构。”苏清颜在白板上画了一个框图,“存算一体我们已经用了。再往上提,只能走‘模拟计算’的路子。”

周明愣了一下。“模拟计算?你是说用电阻阵列做矩阵乘法?”

“对。MA-3用的是数字存算一体,精度高,但面积大、功耗高。模拟计算用电阻阵列,直接在模拟域做乘加运算,面积可以缩小一个数量级,功耗降低一个数量级。”

“精度呢?”方远问。

“精度会差一些。但AI推理对精度不敏感,INT8足够用。训练不行,训练需要FP16。”

林默想了想。“你的意思是,MA-4做推理芯片,不做训练?”

“对。训练用MA-3,推理用MA-4。两条产品线,分开做。训练芯片追求精度,推理芯片追求效率和成本。”

林默看着白板上的框图,脑子里快速过了一遍技术可行性。模拟计算,学术界研究了很多年,但一直没有大规模商用,原因是工艺偏差太大——同一批芯片,不同单元的性能可能差20%,导致计算结果不可靠。

“工艺偏差的问题怎么解决?”林默问。

苏清颜在白板上又画了一个图。“用可编程电阻阵列。每个交叉点不是一个固定的电阻,而是一个可编程的存储单元,可以写不同的电导值。出厂时做一次校准,把每个单元的电导值调到目标值。温度变化时,再校准。”

“校准需要时间,会增加成本。”

“成本增加20%,但芯片面积缩小80%,综合成本还是降了。”

林默看着苏清颜,心里涌起一股暖流。“你什么时候想到这个的?”

“在西北测试的时候。那天晚上睡不着,想了一夜。”

“你失眠就想这个?”

“不然想什么?想你?”苏清颜的耳朵红了。

周明在旁边咳嗽了一声。“你们俩,能不能别在工作时间撒狗粮?”

“不能。”林默说。

MA-4的预研正式启动。苏清颜负责模拟计算阵列的设计,方远负责版图,赵宇负责校准算法,周明负责软件栈。林默负责整体架构和项目管理。

一月中

举报本章错误( 无需登录 )