设计便携式PC或笔记本电脑的散热系统时,为了有效地利用电池资源,同时确保非散热区能够工作在保持其最大特性的工作温度,必须考虑一系列的散热问题。
随着计算机处理性能的不断提高,其功耗也日益提高。在PC和服务器系统中,这会带来一些散热问题,而在要求高性能的便携式PC中,其功耗问题会导致复杂的散热和电源管理问题。
设计便携式PC或笔记本电脑的散热系统时,为了有效地利用电池资源,同时确保非散热区能够工作在保持其最大特性的工作温度,必须考虑一系列的散热问题。在正确的温度限度内工作可延长平均无故障工作时间(MTBF)。
从物理角度来看,一个重要的指标是散热设计功耗(TDP),这是一个基于最坏应用情况的处理器功耗目标。通过使用TDP,系统工程师可设计出对处理器进行适当散热的系统。在便携式设备的情况下,机箱设计、散热片和散热管都从成本和开发角度再次提出设计问题。为了开发出好的散热解决方案,必须将整个系统(包括最坏情况下的处理器功耗)作为一个大的无源散热片来考虑。如果采用风扇散热,设计工程师必须仔细考虑与元件放置及机箱设计相关的气流和空气动力学的影响,以使风扇的效力最佳。
最新的移动处理器提供三种温度监测机理:
(1)内部热敏二极管(一种可用于测量管芯温度的PNP三极管)
(2)内部管芯温度测量方案,可自动降低CPU时钟速率以保持安全温度(PROCHOT#信号)。
(3)温控跳闸开关,当管芯温度达到135℃左右时关闭处理器并且发出THERMTRIP#信号。
便携式和笔记本电脑系统中最热的元件通常是处理器以及图形和内存控制器集线器(GMCH),所以保持这些芯片的理想温度是散热控制中重要的第一步。通过集成在管芯内的特别设计的三极管直接监测管芯的温度,允许用一个智能风扇速度控制器来直接监测管芯的温度。由于直接监测和智能地散热处理器的管芯温度,所以系统的工作温度可更接近于维持要求的MTBF所需要的温度。
内部热敏二极管
片内热敏二极管的温度可以利用一个工作在恒定电流的二极管(或一个三极管的基射极结电压)的负温度系数来监测。可以通过直接测量下式中的Vbe来获取温度值:
Vbe=(nKT/q)ln(Ic/Is)
令人遗憾地,这种方法需要校准以消除Is绝对值的影响,因为Is随不同三极管而变化。一种更好的方法是当同一三极管的集电极流过两个不同的电流时测量其Vbe的变化,其结果由下式给出:
ΔVbe=(nKT/q)ln(N)
其中,K为玻尔兹曼常数,q为电子电荷(1.6×10-19库仑),T为K氏绝对温度,N为两次流过集电极电流之比,n为热敏二极管(TD)的理想比例因子。
为了测量Vbe,传感器在I和NI两个工作电流之间切换。由此得到的波形通过一个低通滤波器滤除噪声,然后经过斩波稳定放大器,它放大并整流波形以产生与ΔVbe成正比的直流电压。此电压值用ADC测量,它以二进制形式提供温度输出。如果对16次重复测量结果取平均值,可进一步减小噪声的影响。
图1:输入信号调理
图1示出了输入信号调理电路,使用ADM1031智能风扇转速控制器来测量外部三极管PNP温度。如果微处理器(MPU)没有内置三极管,可使用一个集电极连接基极的分立三极管。为了防止接地噪声干扰测量,该温度传感器的负端被D输入端的一个内部二极管偏置到高于地电位。如果该传感器工作在噪声环境中,可以加一个典型值为2200pF的电容器C1作为噪声滤波器。使用ADM1031允许对风扇有效的智能控制。风扇可根据热负荷降速或者停止运转,从而节省了功耗并且降低了音频噪声。
温度监控器(PROCHOT#信号)
图2:P4内部温度检测电路
第二种温度监控电路独立地内置于处理器的管心中。由温度决定的检测二极管的对应某一温度的输出电流将与一个参考电流源相比较,如图2所示。此电流源出厂时经过校准并且被设置成当处理器达到最大允许工作温度时可发出PROCHOT#信号。该电流源的设置被锁定的,并且不能改变。从理论上说,PROCHOT#信号似乎是控制处理器温度的一个好方法,除了当处理器处于停止答应、休眠、深层休眠和更深层休眠低功耗状态(内部时钟停止)时不发出PROCHOT#信号以外。当处理器处于休眠模式时,可能仍然消耗正常负载下工作所需要的30%以上的功率。这是由于集成在芯片上的数百万只晶体管的漏电流造成的。其后果是如果处理器进入休眠模式,它仍有可能过热,引起系统非正常关闭。
THERMTRIP#信号
作为由过热引起的处理器损坏的最后一道防线,Intel公司提供了一种简单的温控跳闸开关。当处理器管心温度达到125~135℃时,所有的处理器时钟都暂停,并发出THERMTRIP#信号。由于漏电流可能仍然很高,足以增加硅片的温度,所以Intel公司规定供给处理器的Vcc电源必须在500ms之内关断以避免永久性硅片损坏。THERMTRIP#信号将一直保持,直到产生RESET#信号被初始化。THERMTRIP#信号独立于处理器时钟,所以即使处理器处于停止应答、休眠、深层休眠和更深层休眠低功耗状态(内部时钟停止),也会发出THERMTRIP#信号。
因此,不能依赖PROCHOT#信号和THERMTRIP#信号管理PC的散热性能,因为它们都可能无法(根据取决于系统的温度状况)可靠地防止处理器过热。当系统不能被动地降低其自身温度时,需要主动地将热量从系统中去除。使用独立的温度监控器可能是最佳的解决方案,尽管惟一稳妥的方法是同时使用这三种过热保护机理。
图3:智能温度控制电路
可将片内热敏二极管连接到一个智能风扇控制器ADM1031以提供智能散热控制,控制电路如图3所示。ADM1031利用片内热敏二极管可自动确定处理器何时需要主动散热,从而使用预设置的自动控制环路来接通风扇。与系统适当的散热模式相配合,硬件监视器能够使处理器温度保持在最大工作温度以下,从而确保不发出PROCHOT#信号,并且确保处理器以其最大时钟速率和计算能力运行。这种解决方案有几个优点:达到最大处理性能,并且风扇只在必要的时候接通。这种解决方案可能延长所有受影响器件与温度相关的MTBF。另一个优点在于由于风扇仅在必要时接通,会减小系统的音频噪声。在实际应用中,两个风扇必须为2线或3线风扇。不管TACH1/AIN1和TACH2/AIN2是模拟还是数字输入,都使用单比特控制。
MTBF
一台使用5年的PC完全可以应付文字处理、网页浏览用户的一般要求。所以,20世纪90年代改进的PC经过5年后,其性能完全够用。这个领域的技术可能已经达到稳定水平,除非市场上再出现其他的重大突破性创新。这样的实际效果使最终用户不再像10年前那样不得不升级他们的PC。因此人们更长时间地使用旧系统,使整体可靠性问题成为关注的焦点。产品的生命周期和可靠性也可能因此成为未来PC产品的重要特性。
当今半导体制造商普遍使用的温度和可靠性模型是基于芯片制造协会(Sematech)可靠性技术咨询委员会(Reliability Technology Advisory Board)白皮书——Intel公司和AMD公司于1999年撰写的“基于新半导体技术的可靠性评估的使用条件”。这其中规定使用Arrhenius公式来建立温度影响可靠性的方式的模型,还规定半导体器件的长期可靠性的衰减与温度的增加成正比,遵循按照化学反应动力学描述的幂指数公式。

处理器的故障率(r(t))等于初始故障率(r0)乘以e的负指数常数,这个常数由给定处理过程的活化能(EA)除以玻尔兹曼常数(k)和K氏温度(T)的结果构成。其中EA的值可由具体器件决定,从而通过对器件进行大量采样加速寿命测试和长期现场故障分析统计得到所有器件故障模式的复合活化能。几乎没有半导体制造商会公开其具体器件的复合活化能,因为这个值很大程度上是算出来的,并且很可能产生误解。
值得注意的是,一些半导体制造商承诺其处理器的正常工作年限(例如3年),假定该处理器正确安装并且工作在推荐的工作条件下。因此,如果处理器在整个寿命期内都工作在最大工作温度之下,它最少可以正常工作3年。如果该处理器工作于较低的温度之下,从统计角度说,它应工作更长的时间。虽然Arrhenius公式可以作为一种估算处理器工作时间的通用准则,在不知道特定处理器的复合活化能的情况下精确地预测处理器可能的寿命仍然很困难。
综上所述,可以设置一个监测专用集成电路(ASIC)的独立系统,以便根据温度动态地控制风扇转速,因此这是使系统维持在最佳的工作温度,同时使风扇噪声最小并且潜在地提高MTBF的重要方法。THERM和PROCHOT功能补充了系统监测ASIC的功能,提供了鲁棒性散热管理解决方案。
