Power6芯片执行十进制运算

如果你是本站的忠实读者,你肯定会认为IBM将要推出Power系统服务器产品线上的高端产品Power7+处理器了,这里数量最少而且公司可以从产品线上的每个芯片抽取更多资金。和以往一样,你又猜对了。如果你碰巧正在选购Power
770或Power 780,你需要先停下来,并且好好看看上周三发布的新的Power
770+和Power 780+。

【据《CNET科技资讯网》 2006年10月11日报道】10月11日国际报道
IBM的Power6处理器能够从1数到10。这对于一款时钟频率高达5GHz的处理器而言似乎并没有什么特别的,但Power6能够使用十进制数字0-9,而不是传统计算机通常使用的二进制数字0、1进行数学运算。Power6首席设计师布拉德在接受采访时说,当芯片进行乘法运算时,与我们在小学学习的一模一样。本周二,布拉德在“秋季处理器论坛”上披露了Power6的详细资料。布拉德表示,二进制是Power6的普通模式,但人们更喜欢十进制,在商业数据库中存储的半数以上的数字信息也是十进制的。但是,当计算机将十进制转换成二进制进行计算,然后才将计算结果转换成十进制时,就会出现计算精度问题。他说,有许多软件可以进行十进制数学运算,但在芯片进行十进制运算可以将性能提高2-7倍。但是,十进制计算的速度仍然低于二进制,芯片在一个时钟周期内无法完成更多的工作。Power6是最新款的Power系列处理器。包括低端的PowerPC在内的Power处理器的竞争对手包括英特尔的安腾、Sun和富士通的Sparc、英特尔和AMD的x86。Power6集成有能够加速许多多媒体任务的AltiVec指令集。通过对多个数据元素执行同一条指令,AltiVec能够提高处理器的数据处理效率。这有利于台式机执行音、视频任务,但服务器在运行基因数据处理等高性能计算任务的效率也将提高。布拉德说,AltiVec有利也有弊。AltiVec是一项有用的功能,但目前芯片制造工艺中存在的电流泄露问题意味着,即使是芯片中的空闲部件也会消耗电能并产生热量。IBM曾表示,Power6的时钟频率在4-5GHz之间。布拉德说,Power6的时钟频率更接近5GHz,而不是4GHz。为了与更快的时钟频率保持同步,IBM提高了Power6的通讯能力。布拉德表示,Power5的数据传输速率是150Gbps,Power6的这一数字则达到了300Gbps。布拉德表示,IBM还将大型主机中的一些高端可靠性特性移植到了Power6中,目的是在软件停止运行前发现和修正尽可能多的缺陷。在每个时钟周期,芯片内核会记录它存储的所有数据。如果探测到了错误,芯片内核会恢复到前一个状态,重试处理过程;如果错误比较严重,芯片内核的整个状态数据能够被移植到一个新的处理器内核。他还说,芯片会对每个数据通道进行检查,确保数据在芯片中传输时不会出现错误。每个Power6芯片有2个内核,每个内核配置有4MB二级缓存,Power5芯片只配置有2MB的共享缓存。另外,二个内核可以共享芯片上32MB的三级缓存。Power6芯片的每个内核可以同时执行2个线程,布拉德说,在执行数据库任务时,第二个线程的性能只相当于第一个线程的约55%。为了提高系统的虚拟能力,每个Power6芯片能够每划分成多达1024个独立的分区,每个分区都可以有自己的操作系统。布拉克说,但是,客户不会希望划分那么多的分区,他们也许喜欢最多划分200个分区。利用一级通讯光纤,每个Power6芯片可以直接与其它3个Power6芯片相连,组成一个4芯片模块。每个4芯片模块能够通过二级光纤与其它7个4芯片模块连接成更大的模块。二级光纤可以确保所有芯片缓存的同步。(信息产业部电子科学技术情报研究所)

我在上周的问题中已经解释过了,我不记得IBM上一次在Power系统或之前的AS/400或RS/6000系列中加入新处理器,并横跨整个产品线的大幅度升级的时间了,Power7+这一代会是正常的,它会对产品线进行一个“滚雷式”升级而不是大爆炸式的非正常升级。事实证明,Power7+只会加入两个相比较而言地小批量产品中,而且今年就这样而已了。所以,现在滚雷都在九霄云外。

“其余的产品会在明年加入Power7+,除了Power 795”,IBM
Power体系寰球营销经理史蒂夫·希布里在发布之前跟我解释过,这正好与甲骨文硬件部高级副总裁约翰·福勒的OpenWorld方针不谋而合,甲骨文公司也没有发布16核心的Sparc
T5处理器和相应的系统。“就像Power
595,我们已经将最快的处理器和I/O放入其中了”,希布里解释说。

也就是说,我认为或许有些Power
795店铺会要获得比Power7+芯片已有的L3缓存更大的额外性能,比如每个核心10MB,取代Power7的4MB,还有好几个加速器。当然,这种想法要看IBM能否提供4
GHz或4.25 GHz的Power7+来匹配目前的时钟速度。但显然,Power
795用户在Power8芯片出来之前看不到这种更新了。这是很久以前的事了,但现在又再次上演,似乎IBM在大型主机的领域鲜有竞争对手。富士通的Sparc
Enterprise
M8000和M9000,是甲骨文转售的,运行的是Solaris,其遍布64插槽的3 GHz
Sparc64-VII+芯片开起来有点儿老掉牙的感觉。惠普的装配32插槽安腾9300s的Superdome
2也是如此。富士通正在准备16核心的Sparc64-X,会在代号为雅典娜的64插槽服务器中出现(但没人知道什么时候能用上),Superdome
2机型预计年底前可以升级到八核心的“Poulson”安腾9500s。

因此,在十月三日的公告中,IBM不觉得非要将Power
795s放入其中。也就是说,公司搁置了4千兆内存芯片并与其内存卡供应商合作提供一个更大的256GB内存卡,装有64GB
DDR3内存模块,运行速度1.07 GHz。有了这些内存,Power
795现在的内存增至16TB。如果你是AIX卖家,而且使用系统软件带有的“主动内存扩展”内存压缩算法,你可以让操作系统和逻辑分区把它认成32TB。

现有的Power 795机型使用PowerVM
2.2.2,每核心可以带动多大20个逻辑分区,PowerVM原版及之前的版本支持每核心10个逻辑分区。PowerVM管理程序可以将一个逻辑分区的需求降低至CPU一个核心处理能力的5%,但是出于某种原因系统仍然在仅仅1000个逻辑分区时达到极限,而非你所期望在256核心系统上看到的5120个逻辑分区。有了32TB的压缩内存的能力,这样的一个主机能够给一个逻辑分区分配6.4GB的虚拟内存,这对于给以实用为目的的用户提供IBM
i和AIX能力的云来说已经足够了。问题是,每一片不会有太多CPU,一个机箱大约300
CPW,运行IBM i。算了,那些都是理论。咱们来说点现实的,就是Power
770+和Power 780+服务器。

银河国际手机版最新 1
《图》Power 770+无机架外壳

这些新机器看起来很像IBM一年前发布的Power7’,当时我就觉得IBM要将Power7+芯片放进这些机器里,其中包括改进后的Power
710, 720, 730和740系统,内存增加一倍,改动了PCI-Express
2.0外围插槽,对Power 770 和
780同样如此。(这些机箱在IBM的演示中被其称为Power7′)

在一些文档中我看过有关此次发布的内容,这些最新的机型被称为Power
770+和Power 780+,我也要坚持沿用这一术语。

Power
770+是一种四件套机型,使用的是美国产芯片组,通过使用NUMA(非一致存储器访问)集群,可使多个服务器节点被链接到一个共享存储系统上。我们在Power5时代就在IBM企业级机器上见过这种架构。这种制造机器的方式比制造像Power
595或Power
795这种大的机器更简单和廉价,后面两者有更多的核心,内存,更多的输入输出上的投入,为的就是用于真正的大型计算工作。在IBM目录中被称为9117-MMD,Power
770+每个机箱上有两个处理器卡,和去年Power
770’机型一样,每个处理器卡有两个处理器插槽。因此是每个机器四个插槽,在一个单一系统上有多达16个插槽。另一种归类方法是就插槽数量为言,是Power
795的一半,与Power 595数量一样。

银河国际手机版最新,如果你觉得你需要起步适度,但扩展迅速,那么Power 770, 770′ 或 770+
是最适合你的。比方说,你是中国的一个SAP卖家。或是你在中国有1000个SAP商铺。诸如此类。

Power
770+没有使用八核心Power7+芯片,因此机器的可扩展性或许不会有你认为的那样高。事实上,大概是因为IBM用来蚀刻Power7+芯片的32纳米工艺的产量没有那么高(或许也是这些芯片去年没有问世的原因),IBM很明智地(和所有芯片制造商一样)正在回收部分残次品,分离有错误的芯片。这样一来,IBM在用于Power
770+处理器的Power7+芯片上配置了三核心4.2GHz或四核心3.8GHz,每个核心仅配置10MB的三级缓存。

使用32GB内存条,Power 770+的主内存可以提升至4TB,和Power
770’一样,我觉得在Power 770+上使用Power
795上能用的64GB的内存条还可以增加一倍达到8TB,或是Power
795的一半,如果IBM要这么干的话。但是在这种卡在Power
770+上并不能使用,因为IBM需要给消费者一个买Power 780+或是升级Power
795内存的理由。

使用IBM的商业性能负载(CPW)基准测试来测量OS/400和IBM
i服务器家族的相对性能,一个有四核心4.2 GHz处理器的Power 770+评分为90000
CPW,大约每核心7500 CPW。这种带有四核心运行速度为3.8
GHz的Power7+芯片的机器评分为110000 CPW,约为每核心6875
CPW。当你给这些系统添加处理器,提升核心数量至48或64,对称多处理和非一致性存储访问对保持内存和缓存一致性的开销用掉了很大一部分的总体原始性能,就像在任何其他多插口服务器上发生的一样。48核心的Power
770+(4.2GHz的三核心芯片)评分为306,600
CPW,64核心(3.8GHz的四核心芯片)评分为379,300 CPW。

正如我之前所说,使用IBM
i商店,在各种机箱下你总能买到最快的核心,因为你付费的软件是依赖于运行的核心而不是机箱的整体性能。此外,IBM
i商店往往有很多的批处理工作,本质上就是单片的,喜欢时钟频率越高越好。(如果IBM有一个低速的3GHz
Power7+芯片,所有核心的80MB三级缓存全开,我觉得这种配置真正有助于批处理工作,都是因为缓存。但IBM没有,所以无所谓了。)

发表评论

电子邮件地址不会被公开。 必填项已用*标注