什么是 DFT(Design for Testability)?为什么很重要?
DFT用大白话的角度来说,它就是芯片的体检过程!手机里指甲盖大小的芯片,里面藏着几十亿个比头发丝还细的晶体管,工厂是怎么知道它好坏的?总不能拿个放大镜一个个看吧?这就需要给芯片设计专门的”体检通道”,行业里叫DFT(可测性设计);在设计芯片时提前留好”观察窗”和”操作口”,让后续测试能精准又高效地发现问题。就像盖房子时要预埋水管电线,总不能等墙砌好了再砸墙布线吧?
以前芯片简单,功能测试就能应付——给芯片通电,看看它能不能完成该做的事。但现在情况完全变了。首先,缺陷太小了,7纳米工艺的晶体管,几百个并排起来才有人头发粗,制造过程中稍微有点杂质就可能出问题,但这些小毛病用普通功能测试根本发现不了,就像用渔网捞不住水里的微生物。
更头疼的是测试成本。现在测一颗高端芯片的设备要几千万,测试时间越长,分摊到每颗芯片的成本就越高。没有DFT的芯片,测试时间可能是有DFT芯片的10倍以上。你想想,手机厂商一次买上百万颗芯片,每颗多测10秒,总成本就得增加多少?业内统计,测试已经占到芯片总成本的40%,要是再不管,以后造芯片可能还不如测芯片贵。
还有个要命的问题是质量。汽车芯片要求每百万颗里最多只能有1颗坏的(DPPM<1),医疗设备更是要求零缺陷。这些芯片要是带隐患出厂,在汽车自动驾驶时突然死机,或者心脏起搏器出故障,后果不堪设想。DFT就像给芯片做”CT扫描”,能在出厂前把那些”先天不足”的次品都筛出来。
DFT的核心思路其实特简单:解决两个问题——能不能控制和能不能看见。控制就是我想让芯片内部某个节点是什么状态,就能设成什么状态;看见就是芯片内部发生了什么,我能清清楚楚地读到。这就像医生看病,既要能给病人做检查(控制),又要能看到检查结果(看见)。
扫描链技术是最基础也最有效的一招。芯片里有很多存储数据的”小盒子”(触发器),DFT把这些小盒子用”线”串起来,像穿珠子一样连成一条长链。测试的时候,就可以通过外部引脚把测试信号一点点”移”进去,再把结果一点点”移”出来。这就相当于给芯片装了个”内部状态读写器”,不管多深的逻辑单元,都能查得明明白白。
存储器测试(MBIST) 专门对付芯片里的内存。手机里的运行内存(RAM)有上百亿个存储单元,怎么知道每个单元都好用?DFT会在内存旁边集成一套”自测电路”,它能自动生成各种测试图案,比如先写0再读0,写1再读1,或者故意写个棋盘格图案,快速找出坏单元。这个过程比用软件测试快100倍以上。
边界扫描(JTAG) 是专门检查芯片引脚和外部连接的。以前芯片焊在电路板上,如果某个引脚接触不良,得用万用表一个个量,麻烦又容易出错。JTAG在芯片引脚旁边放了一圈”扫描细胞”,能像检查水管漏水一样,轻松找出哪个引脚断了或者短路了。现在几乎所有芯片都支持JTAG,连修手机的师傅都用这个技术诊断故障。
这些技术组合起来用,能把芯片的故障覆盖率提到95%以上,也就是说100个毛病能找出95个,比瞎猜强太多了。
有人可能会问:加这么多测试电路,不是浪费芯片面积吗?确实,DFT通常要占5%-15%的芯片面积,还会增加一点功耗。但这笔钱花得绝对值。
举个例子,汽车芯片的DFT不仅要检测制造缺陷,还能在汽车开了几年后,让4S店通过专用设备给芯片做”体检”。特斯拉的自动驾驶芯片就有这种功能,能实时监测关键电路的健康状态,发现问题提前报警。
再比如手机芯片,现在高端处理器都用7纳米、5纳米工艺,一颗芯片成本好几十美元。如果没DFT,测试不出来的坏芯片装到手机里,到用户手上才发现问题,那退换货、品牌损失可比DFT那点成本高多了。实际上,有DFT能让测试时间缩短70%,反而能大大降低总成本。
当然DFT工程师也不是随便乱加电路的。他们会精打细算,比如把扫描链的功耗控制在正常工作时的十分之一以下,确保不影响芯片性能。就像给病人做检查,既要查得准,又不能影响病人正常生活。
现在芯片技术发展太快了,开始流行把多个小芯片(Chiplet)摞在一起,或者3D堆叠。这时候DFT就更重要了——不仅要测试单个小芯片,还要测试它们之间的连接。就像现在不仅要检查每个房间有没有问题,还要检查房间之间的门通不通。
以后量子计算机出来,DFT的挑战就更大了。量子比特特别娇贵,看一眼都可能改变它的状态(量子观测效应),怎么测试?这得发明全新的测试方法,可能比现在的DFT复杂十倍。
说到底,DFT就像芯片产业的”质量保险”。我们买手机、开汽车时,很少会想到芯片里藏着这么一套精密的”体检系统”,但正是这些看不见的电路,默默守护着我们使用电子产品的安全和可靠。下次你用手机扫码付款,或者坐自动驾驶汽车时,不妨想想:这些高科技背后,还有DFT这样的幕后英雄在保驾护航呢。
|