账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
多重执行绪核心架构探微
打造新一代嵌入式SoC

【作者: Vivek Sardana】2006年06月02日 星期五

浏览人次:【9462】

全球各地的SoC研发业者都正面临日趋严苛的成本与功耗限制,却又必须在产品设计中加入更好的效能与更多的功能。


以往有些业者藉由提高处理器的时脉速度来增加效能,但这样通常会提高系统的耗电量。并且因为记忆体技术发展跟不上处理器技术,如(图一)所示,这种时脉速度不匹配的情况让系统效能难以大幅提升。因此提高时脉速度所获得的效能提升反而呈现递减的现象。


《图一 处理器与内存速度不匹配,造成系统效能提升的瓶颈》
《图一 处理器与内存速度不匹配,造成系统效能提升的瓶颈》

<资料来源:http://www.sun.com>


采用多重核心是另一种提升效能的方法,但这种方案会因核心晶片尺寸成倍数增加而付出更高的成本。效能提升的代价就是大幅增加的矽元件成本以及系统耗电量。


搭配两个以上的多重执行管线核心也是另一项提升效能的方法。此方案仍有晶片尺寸大幅增加的缺点,而且如何充分利用多个执行管线以达高效能仍是一大难题,因此使用者常需要修改软体,才能达到多重执行管线所带来的效能。


以上所列的三种提升效能的方法都有其限制以及附带的高成本、高功耗代价。本文所要介绍的多重执行绪方案即是要以最少的代价来达到最大的效能提升。多重执行绪核心,藉由多重执行绪来消弥记忆体存取延迟时所浪费的周期。当某个执行绪因记忆体存取延迟或其他原因而停止运作时,多重执行绪核心可立即选择处理其他执行绪以填补执行管线的空档,如此一来核心执行管线使用率大幅增加,应用程式的处理流量也因此大幅提升。


在单核心环境执行多重执行绪

MIPS32 34K系列核心能在单核心内执行多重执行绪,提供SoC业者一个崭新的核心方案,让业者可以运用既有的软体基础建设来提高系统效能、降低系统成本及功耗。 34K核心非常适用于各种需要高效能及高度即时处理的应用,例如机上盒(set-top-box)、VoIP、多功能印表机及数位电视等。这些产品系统上都有许多工作需要同时处理,34K能利其多个执行绪对这些工作予以平行处理。


降低总持有成本与功耗

除了多重执行绪功能外,34K还具备有数位讯号处理延伸指令集,因此让业者能省去系统中如DSP的硬体元件以降低整体成本。另外由于效能的提高,同样的功能需求可以较低的时脉频率来达成,系统功耗也因而降低。


34K系列核心技术

从已发展成熟的24KE微架构所开发出34K系列核心,运用九级执行管线,另加少量的额外硬体以为虚拟处理单元(VPE)、执行绪状态(TC)以及服务品质(QoS)控制等之用。


《图二 MIPS32 34K 处理器设计方块图》
《图二 MIPS32 34K 处理器设计方块图》

(图二)虚线以下为支援二个虚拟处理元件(VPE)及五个执行绪(Thread)的34K硬体方块图,虚线以上软体部份显示在五个执行绪上执行的五个程序(Process ),以及在二个虚拟处理元件上运转的二个作业系统。


如图所示,硬体部份中每个执行绪都有自己专属的执行绪状态硬体资源(Thread Context;TC),每个TC中包含了执行绪自己专属的一组普通暂存器( General-Purpose Register)以及程式指令位址计数器(Program Counter),可用来支援像Linux这种作业系统中的一个程序(Process)独立执行。另外每个执行绪也都拥有自己的指令缓冲区及指令预先撷取的机制,如此一来核心即可在无任何延迟之下于每个时脉切换执行不同的执行绪(程序),执行管线也因此可一直保持在忙碌状态。


在每个虚拟处理元件(VB)中,执行绪除了各自有自己的TC之外,彼此之间则分享例如给作业系统核心所专用的各种系统控制暂存器等其他资源。


共用的系统控制暂存器与所属TC即构成一个VPE(如图二所示,二个TC属于VPE0,三个属于VPE1)。一个在执行某个执行绪的VPE,就像是一个独立、且完全相​​容于MIPS32架构规格的MIPS中央处理器。


在多核心与多处理器系统中,由于各个核心或处理器各有自己的快取记忆体,因此必须耗用许多运算周期以及硬体逻辑来协调管理不同的核心或处理器,以确保快取记忆的内容同步(Cches coherency)。 34K核心中所有的VPE以及所有执行绪都共用一个相同的快取记忆装置,因此避免了这个问题。


在不同的应用需求下,34K核心可设定最多5个TC以及2个VPE。这种组合提供了最高的空间使用效率与运用弹性。


服务品质(QoS)

34K核心系列的多执行绪技术还搭配QoS的功能。在基本设定状况之下,QoS引擎以轮流的方式,在每个周期交错处理可运作的执行绪指令,以达到最大的整体应用处理流量。所有执行绪借此方式,公平分享处理器的效能频宽,有效运用执行绪彼此因记忆体存取或其他因素所造成的执行空窗周期。另一方面,在不同的应用状况之下,使用者也可以设定QoS引擎来针对不同执行绪给予不同的处理频宽,如此即可让像是通讯、视讯与音讯处理等有即时性要求的工作达到服务品质的目标。


如(图三)所示,服务品质的运作以阶层方式来完成。首先使用者(Software Application)按QoS的需求为不同执行绪设定不同的处理频宽,硬体内建的规则管理机制(Policy Manager)会根据所分配到的频宽,给予执行绪一个优先等级,并同时观察执行绪的处理进度,依状况随时向排程器(Dispatch Scheduler)提供执行绪优先顺序的参考资讯。 Dispatch Scheduler然后依此资讯于每个周期安排一个执行绪供执行单元执行,如此即可达到使用者所设定的QoS要求。


《图三 QoS系统阶层》
《图三 QoS系统阶层》

软体运用模式

最后要谈的是多执行绪核心的软体运用模式。 34K核心可依不同组态运用于许多不同的软体运用模式上,本文将只列举其中二种模式供读者参考,如(图四)与(图五)。另外特别值得一提的是大部份的现有软体不经修改即可在这些软体运用模式上使用,此一优点对必须快速推出产品的系统研发业者有非常的重要性。


如图四所示,在一个最简单的多重执行绪运用模式中,AMVP(Asymmetric Multiprocessing on VPEs)系统让两个作业系统(OS)同时运作,每个作业系统在自己专属的VPE上执行自己的执行绪。在大多数的状况下,这两个作业系统通常是以往分别在不同MIPS核心上运作的传统作业系统(例如像支援控制层面应用的Linux,以及负责处理资料应用的RTOS)。


将所有功能整合至单一核心可以节省成本、尺寸以及功耗。这种单晶片、单核心的SoC,可以像以前一样由两个作业系统来进行控制,使用者也几乎不必修改作业系统或程式码,因此是一个超低风险进阶至更高效能SoC元件的方法。



《图四 一个AMVP(Asymmetric Multiprocessing on VPEs)同时执行两个操作系统》
《图四 一个AMVP(Asymmetric Multiprocessing on VPEs)同时执行两个操作系统》

另一个软体运用模式如(图五)所示。由于34K具有极佳的组态设定弹性,业者可在一个VPE上执行像是家用闸道器的控制功能,并在第二个VPE上透过4个TC来支援4个VoIP频道,借此大幅降低系统成本。


《图五 可支持多个VoIP频道的家用网关》
《图五 可支持多个VoIP频道的家用网关》

结论

虽然极多的嵌入式系统具有各种功能必需同时运算处理的特性,但单执行绪处理器并无法利用这种特性来有效地提升处理的效率,提高时脉速度固然可以提高效能,但记忆体存取延迟却严重限制系统效能的提升幅度。多重执行管线的超纯量(superscaler)处理器,因为会造成矽元件成本增加以及设计复杂度,效能也无法大幅提升。另一种方法则是多核心设计,这种方法确实能在某些系统中提升效能,但矽元件成本以及耗电量随核心数目呈倍数增加,也使这项技术无法运用于众多嵌入式产品。


34K系列核心以多重执行绪技术避免了上述的缺点,藉由同时处理多个软体执行绪来消除记忆体延迟所造成的影响,大幅提升系统效能、节省成本,并减少功耗及晶片尺寸增加的幅度。同时MIPS 34K系列核心的QoS功能让使用者能针对即时处理作业配置专属的处理频宽,以满足嵌入式应用的即时处理要求。


(作者任职于MIPS Technologies)


延 伸 阅 读

高效能的多重执行绪技术,能让设计人员省去许多系统元件,例如额外的数位讯号处理器(DSP)。客户也可运用先前方案中已开发的软体使以前所作的投资能被充分利用,以上的特点大幅降低了总使用成本。相关介绍请见「多重执行绪技术:提升嵌入式系统效能的新推手」一文。

英特尔的超执行绪技术用意在提升处理器的效能,但却有技术专家指出,这种技术反而造成伺服器的效能出差错。专业技术人员指出,就安装SQL Server与Citrix Terminal Server的系统而言,支援英特尔超执行绪技术的主机板在沈重工作负荷下的效能显著降低;但一解除HT,系统就恢复预期中的水准。你可在「超执行绪有损伺服器效能?」一文中得到进一步的介绍。

多重执行绪游戏引擎已成为游戏设计的关键技术,让研发业者能将游戏中特定部份的程式 码,例如物理模拟与人工智慧,分配至多个执行绪中。运用多核心处理器以及支援HT技术, 每个逻辑核心都能独立处理特定的执行绪,将运算负荷平均分配至不同的逻辑核心。在「多核心处理器与多重执行绪」一文为你做了相关的评析。

市场动态

美普思科技(MIPS)推出 MIPS32 34K 内核系列,它是针对高性能和成本敏感的嵌入式应用的一种革命性多线程解决方案。 34K 核心系列是首个执行MIPS MT ASE,并利用包括 MIPS DSP ASE 成熟的 24KE 微架构的产品。 34K 内核的多工能力可显著降低整体晶片尺寸、成本和功耗。相关介绍请见「MIPS新解决方案为嵌入市场提供重要系统性能」一文。

Express Logic以MIPS32 34K MT处理器内核系列新推出了ThreadX RTOS,该公司与MIPS合作开发的ThreadX/MT,为用于MIPS 34K内核的ThreadX嵌入式版本,采用了MIPS MT ASE的多线程能力,当用于34K处理器内核时,其性能具有重大的提高。获得34K内核许可的用户即可使用该解决方案。你可在「Express Logic以MIPS32 34KMT处理器内核推出了ThreadX RTOS」一文中得到进一步的介绍。

美普思科技(MIPS)发表新款32位元可合成嵌入式处理器核心,这款内建DSP功能的MIPS32 24KE 系列核心汇整RISC/DSP功能,可提供消费性电子厂商降低成本、晶片尺寸与功耗的解决方案。适合视讯转换器、数位电视、DVD录影机、语音交换器、IP电话与数位相机等产品上。在「MIPS新型32位元处理器核心内建DSP」一文为你做了相关的评析。

相关文章
MIPS抢攻行动市场策略能否奏效?
[专题]低价智慧手机 引爆全球商机
Computex Taipei 2009展后报导
MIPS32 M4K核心阴影缓存器微控制器应用简介
加速SoC软件开发时程
comments powered by Disqus
相关讨论
  相关新闻
» 豪威集团推出用於存在检测、人脸辨识和常开功能的超小尺寸感测器
» ST推广智慧感测器与碳化矽发展 强化於AI与能源应用价值
» ST:AI两大挑战在於耗能及部署便利性 两者直接影响AI普及速度
» 慧荣获ISO 26262 ASIL B Ready与ASPICE CL2认证 提供车用级安全储存方案
» 默克完成收购Unity-SC 强化光电产品组合以满足半导体产业需求


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.2048.52.15.196.4
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw