HP ASIC
“我们整合到配备 AMD Opteron 的 ProLiant DL585 服务器后,我们简化了运作并节省了大量资金。”
– 惠普公司电子设计自动化部经理 Ben Buzonas
商业需求:
惠普公司的特定应用集成电路 (ASIC) 设计团队 – 较早采纳了基于 Linux 的电子设计自动化 (EDA) 软件和用于 32位应用的行业标准服务器 – 负责开发和测试 HP ProLiant 行业标准服务器中所使用的 ASIC。因最初缺乏 64位 Linux 和 64位行业标准服务器,这迫使该小组不得不保留很多传统工作站,以提供复杂应用和模拟所要求的支持。
解决方案概述:
配备 AMD Opteron 处理器的新型 HP ProLiant DL585 4路服务器,再加上市场出现的用于Red Hat Enterprise Linux 的 Synopsys EDA 开发工具,为惠普 ASIC 设计团队提供了理想解决方案。能同时运行 32位和 64位应用的、配备 Opteron 的服务器,可满足所有EDA 开发需求。
设计成果
惠普 ASIC 团队利用 ASIC 技术为 HP ProLiant 服务器设计和实施关键功能。ASIC 芯片集成了硬件逻辑,通常可加速传统上也许通过软件实现的关键功能,因此可改进整体系统性能和可靠性。
作为其主要任务,该惠普团队设计和测试为 ProLiant 系统提供远程管理和存储控制功能的 ASIC。这些 ASIC 电路都是 HP Remote Insight Lights Out Edition II (RILOE II) 与 Integrated Lights Out (iLO) 标准远程管理解决方案以及集成智能阵列控制器的关键组件。
过去,该 ASIC 小组主要使用 64位 Sun 工作站来进行设计和验证。在 2000 年和 2001 年期间,该小组将其一部分工作转移到运行 Red Hat Linux 7.3 操作系统的 ProLiant DL580 和 DL380 服务器之上。同时,该小组也开始采用 Linux 版本的 Synopsys ASIC 设计工具。虽然随着 ProLiant 系统的面世,32位应用的性能有所改进,但该小组仍发现,要依靠老旧的 Sun 工作站来提供其 64位功能还是太过繁琐。
“Sun 公司曾一度是此类高性能计算机群事实上的标准” ,电子设计自动化部经理 Ben Buzonas 指出,他管理的九人 EDA 小组负责监督惠普各 ASIC 设计团队所使用的 EDA 软件和计算环境,“随着更多人采用 Linux 来进行 EDA,以及惠普公司推出配备 Opteron 处理器的行业标准 HP ProLiant DL585 服务器,我们已经能放弃专有平台了。我认为很多小组都会采取这条途径。性能的改进、通过平台间整合而实现的更高效率乃至所节省的许可证费用等都是惊人的 – 这些效益是不能忽视的。”
整合使计算机房不再必要
在 2003 年秋季,Synopsys 宣布将支持 Opteron 处理器和 Red Hat Enterprise Linux 操作系统。在 2004 年五月,Buzonas 及其团队开始准备要升级到运行新型 Synopsys 和 Red Hat 等解决方案的新款 ProLiant DL585 上。Buzonas 回忆说:“将我们的平台整合到 DL585 之上的前景是令人振奋的。我们在当时不仅希望实现性能的提高,而且我们也很看好整合到能同时支持我们的 32位和 64位应用及模拟的单一行业标准平台之上的想法。”
到 2004 年十月底,该惠普 EDA 小组完成了全面升级,用 40 套分别配备四个 Opteron 2.4 GHz 处理器的 ProLiant DL585 系统取代了 100 多台 ProLiant 和 Sun 服务器。与传统系统相比,这些新型 ProLiant 服务器马上就实现了 3.5 倍的性能提升。
该 EDA 小组还从 Red Hat Linux 7.3 升级到了 Red Hat Enterprise Linux。Buzonas 解释说:“我们也遇到了您一般在重大升级中所能设想的挑战。我们不得不重新考察我们的所有应用在新平台上能否运行,而实际上这比我们设想的更加顺利。我们如此轻松地就升级到了配备 64位 Red Hat 的 HP ProLiant DL585 平台上,真是有点出乎意料。”
该小组从节省的空间中立刻得到了好处。原先,计算资源占用了位于不同大楼内的两个计算机中心。在整合到仅 40 个 ProLiant DL585 4U 机架安装系统后,整个一个计算机房就变成了多余。
四两拨千斤
许可证成本的降低带来了更大的兴奋。Buzonas 强调说:“我们将每年 EDA 软件许可证成本压缩了大约 800,000 美元。通过减少我们所使用的 CPU 的数量,我们也就能相应减少许可证的数量。尽管我们减少了 CPU 数量和软件许可证数量,但性能却稳定提高了 3.5倍,使得我们能实现总吞吐量的提高。”
据 Buzonas 介绍,每个 ASIC 芯片的平均开发时间一般在六至十二个月,而一般的产品寿命则为两到三年。每种下一代 ASIC 芯片都会采用更高的门电路密度和更丰富的功能,并要求越来越复杂的测试情况和模拟。设计人员利用结构化和随机模拟来验证逻辑体系结构和性能。
团队成员需要排队等候进行模拟任务 – 可能需要 15 分钟乃至好几天才能完成 – 利用Platform Computing 公司所提供的 Platform LSF 批工作量管理系统。一对 ProLiant DL380 服务器负责管理工作量系统。而 LSF 资源库 – 配置成给每个 CPU 安排一项任务,以最大限度提高任务执行和许可证利用率 – 则意味着,在同一个 ProLiant DL585 服务器上可同时运行最多四个模拟任务。
“我们需要混合运行 32位和 64位应用和模拟,所以,我们选用了配备 AMD Opteron 处理器的 HP ProLiant DL585 服务器– 它甚至在一个系统上都能同时运行这两类任务。这就使我能放弃我们以前的 Sun 工作站,然后整合到一个更高性能的平台上。”
– 惠普公司电子设计自动化部经理 Ben Buzonas
Buzonas 认为,最棒的一点是,该小组只需将任务装载到 Platform LSF 调度系统之中,等到有 CPU 空闲时,该系统就会自动启动这些任务。配备 AMD Opteron 的 ProLiant DL585 服务器能同时运行 32位和64位应用,从而减少管理问题并提高利用率和效率。
当被问及他的小组是否使用基于他们自己的 ASIC 的解决方案时,Buzonas 回忆说:“Integrated Lights Out 多次挽救了我们。我们将 HP Systems Insight Manager 设置为,当系统开始出现异常或错误行为时就寻呼我们。有几个星期五晚上,iLO 及时通知了我们的人员,使他们能从家里登录网络去解决故障或重新启动系统。”
Buzonas 最后说:“我们的目标是让我们的计算机群集每天 24 小时越忙越好。今天与以往相比,我们向着这个目标的实现走得更近了。我在此敦促公司中仍在使用旧式 Sun 工作站进行技术计算的其他小组都能认真考虑一下配备 Opteron 处理器的 HP ProLiant DL585 服务器。它本身绝不仅仅能帮助您提高吞吐量、降低许可证成本和改进管理效率。”