联想凌拓芯片设计行业存储解决方案

1.芯片设计行业及存储

从市场发展趋势来看，集成电路市场正在加速向中国迁移，市场格局加快调整，云计算、物联网、智能制造,大数据、VR、Pre 5G等新业态引发的产业变革刚刚兴起，新的商业模式不断产生会催生更多芯片需求，集成电路产业格局面临重塑的机遇，这将是中国集成半导体电路企业面临的机会。

电子设计自动化（Electronic design automation EDA）软件是由中国集成半导体电路企业使用，以创建高度复杂的集成电路（ICS）。芯片设计器件尺寸不断缩小，从90nm几年前14nm,10nm,7nm,5nm和 FinFET，这意味着设计的复杂性和设计元素的数量大幅增长。随着尺寸越来越小，更长的时间花费在逻辑和物理验证阶段，其中大量的模拟和测试台运行，以验证设计功能和完整性。由于执行成本的上升，设计验证正在成为一个重要组成部分的整体设计周期。虽然各种工具供应商已经拿出更快的应用程序来运行这些模拟，配合同样强大的和优化的基础架构包括存储，以获得更优的性能来缩减上市时间为最重要的目的。
在逻辑验证阶段发生的建模和仿真消耗大量的计算资源，这取决于芯片设计的大小和复杂性。为了在复杂设计的模拟过程中适应这些芯片设计，它每年都会增加计算基础设施。在验证过程中，通过网络共享存储 (NAS) 基础结构生成、写入和读取大量文件。这种EDA工具在其不同的构建和模拟阶段生成了许多文件，这些文件存放在NAS存储上的不同目录结构中，随着计算场的规模不断扩大，共享存储基础设施也必须横向扩展（增加存储节点），以处理所需的I/O操作、带宽和延迟的验证。而网络文件系统（NFS）v3是验证环境中最流行的基于文件的协议。

2.联想凌拓存储行业方案地位

联想凌拓是EDA和半导体市场的主要存储供应商，Data ONTAP几乎所有的半导体软件公司在使用，而国内外芯片行业巨头几乎全部使用联想凌拓存储存取构建和模拟测试设计（DUT）所需的所有文件，以及在此阶段的生命周期内生成的文件。

在 EDA 芯片设计周期中使用的工具多达上百种，要在数据中心部署存储阵列，就需要了解不同的工具和应用程序生成的关键工作负载。联想凌拓客户团队在 EDA 核心团队的指导下，更接近真实的环境下获得令人满意的结果，缩短作业完成时间和时钟时间，优化 EDA 工具的许可成本，始终是联想凌拓一如既往的目标。

联想凌拓存储NAS功能作为基础设施的共享访问网络文件系统（NFS）和二进制文件的设计的，提供高可用性和弹性的解决方案来存储和管理数据从芯片设计过程中产生的。群集文件系统提供了扩展和扩展存储体系结构，为验证阶段生成的许多目录中的数百万文件提供存储。它解决了芯片设计不断增长的存储需求，同时有效地处理了在整个芯片的验证工作流程中生成的不同工作负载。Ontap群集文件系统提供了以下关键功能，以缩短芯片设计过程，加快上市时间并提高投资回报率（ROI）。

本文将对优化网络存储的数据中心基础设施的半导体公司用于设计与EDA工具的下一代芯片提供最佳实践。.

3.芯片设计流程

在一个典型的芯片设计工作流程大致有两个阶段，如图所示：逻辑(logical）和物理(physical)。逻辑阶段包括初始规范(Initial Spec)和逻辑设计(Logical Design)。物理阶段包括将逻辑设计转换为物理芯片，在签署和退出阶段，最终检查完成后，设计交付给晶圆厂制造。

• 逻辑设计Logical design.

这是芯片设计过程的第一阶段，在这一芯片的架构和使用的语言，如Verilog建模。为了模拟设计，这些源文件被读取和编译成一个可执行的芯片模型。这个阶段也被称为VC编译或建设阶段，和SIMV是可执行的，是由过程中创建的默认名称。芯片模型的大小和特点是设计相关的。

芯片模型创建后，进行芯片设计模拟。用户通常通过使用作业调度程序提交或运行计算场中的作业。测试是用来验证逻辑设计行为，并检查是否设计相匹配的意图和目的的芯片最初感知。在设计确定为相对无故障后，逻辑设计被传递到流程中的下一个阶段，称为后端或物理设计，其中逻辑设计转换为实际物理芯片。

在存储角度，在逻辑设计的建立和仿真阶段表现出高I / O负载特性(90%Metadata操作，检查深目录结构的目录/文件属性，并确定文件是否在创建前存在，getattr也时产生的应用程序试图读取文件关闭,打开后检查一致性（check close to open consistency -CTO）延迟问题多数发生在高量的getattrs, Lookup-长路径，生成多个查找。

• 物理设计Physical design.

在这个阶段，逻辑设计被转换成一个实际的设计，可以被制造成一个芯片。在这个过程中发生的几个步骤，包括逻辑合成，布局和路由，以及各种性能和可制造性检查。设计规则检查（DRC）进行验证的物理布局准备制造，随着版图与原理图（LVS），这保证了物理和逻辑电路匹配。在此阶段还可以进行提取、定时和其他检查，以确保芯片设计满足其目标规格。
在物理设计阶段同样表现出高I / O负载特性。

• 签署和退出阶段Sign-off and tape-out.

最后的检查都是在这一阶段，包括DRC，LVS，定时，功率和信号完整性。在所有检查都通过后，该设计被记录到指定的大文件，用铸造和工艺节点制造。
在签署和退出阶段是大文件读写，表现出高带宽的负载特性。

• Tape-in.

这个阶段发生在晶圆厂或制造tape-in。这个阶段不同的操作例如，缩放和萎缩，光学邻近校正/分辨率增强技术（OPC / RET），数据和工作组成进行压裂，以确保前期的设计可用于硅芯片的制造。

3.1 逻辑设计（Logical design Design）工作流

典型的逻辑芯片设计工作流程如图2所示，由以下四部分组成:

• Create.

在这个阶段，设计人员通常会从软件配置管理（SCM）系统中检查源代码树，以创建或编辑设计规范。源代码往往是在语言如Verilog或超高速集成电路（超高速集成电路硬件描述语言（VHDL））。也许是一种常用的配置管理工具，管理和控制源代码的不同版本。

• Schedule.

设计师和验证工程师需要执行许多编译和模拟工作，以验证他们的设计。作业调度器通常用于管理大量的作业，并在大型计算场中高效地提交作业。IBM Platform Computing公司的负载共享设施（LSF）用于EDA用户场景的共同调度。

• Execute.

作业调度程序为EDA应有程序作业配置了可用Slots的数目，经常会在工作直到资源可供他们运行。在作业分配了一个slot后，它将开始执行EDA应有程序的构建或模拟，由提交该作业的用户指定。这个过程的EDA应有程序通常会持续到有时超出了设计tape-out的事件设计错误被捕获和恢复修复启动，以尽量减少成本和返工。

• Store.

存储层以Volume和aggregate的形式提供大型容器来存储和管理所有不同的设计文件，这些文件可以在数以百万计的。存储工程作为工具和工作负载之间共享文件的中心位置。联想凌拓存储还提供了其他的存储效率和其他好处，在本文的后半部分讨论了。

3.2 EDA典型的存储工作环境

下图代表了一个典型的EDA环境，用户提交成百上千个并发工作队列。调度程序将作业发送到计算服务器池（Server Pool），它有数万甚至数十万个CPU Core来处理作业，从而产生大量文件存取于共享存储中。
EDA应用程序提交的作业生成I / O执行读取，写入，修改和删除操作，这些操作在本质上是高度并行的。EDA应用程序读取并编译各种源文件，为每一个芯片设计生成一个可执行文件，此可执行文件用于模拟由不同的测试台。

VC的应用程序生成一个深的目录结构，在一个单一的目录包含大量小文件和子目录，该目录结构宽而深，EDA应用其实是一个巨量文件数的工作环境，在实质上是深而宽的许多目录和子目录，文件近数百万。
在VC的编译和仿真过程中，大量的元数据操作如NFS getattrs，setattrs，查找和访问调用随着打开，关闭，删除链接，并修改生成工作负载的一部分。其余部分的工作量包括读和写操作是高度顺序的性质。

多年来，ASIC设计的复杂性的增加已经提出了一个重大挑战，EDA应有程序的工作完成时间从不同的应用程序和基础设施的瓶颈，最近的一项行业调查表明，33%的EDA性能瓶颈是源于存储。

4.EDA环境下的挑战

复杂的芯片设计在计算服务器池（Server Pool）中运行的验证作业的数目相应增加，但以非线性方式增长。然而，存储和管理这些大型设计文件的后端存储通常没有优化以处理不断变化的工作负载。本节强调了应用程序和存储管理员和架构师在EDA环境中遇到的主要挑战。

4.1 EDA 应用层面的挑战

缩短上市时间对半导体芯片制造商至关重要。因此，能够同时运行并行作业并快速完成它们是一个很强的要求。运行时间的任何改进都会造成巨大的差异。以下是一些风险投资应用程序所面临的主要挑战：
• 大多数半导体环境将在本地驱动器上同时运行不同的芯片设计的多个验证过程，这些设计后来被转移到共享存储。在逻辑设计过程中管理和维护来自不同自动化工具和脚本的结果是艰巨的任务。
• 半导体芯片的设计越来越复杂，越来越多地产生更大的文件和更多的文件数量。为了确保高I / O性能的EDA工具，重要的是要在控制器的内存（DRAM），以有效地服务I / O请求在设计过程中，以适应积极的工作集大小。
• 在芯片设计过程中，一些EDA作业可能会产生更多的I/O请求（包括读写），从而导致存储资源的瓶颈。识别和管理失控的工作和平衡存储资源的挑战。
• 控制成本优化EDA工具，以更好地执行所产生的工作量是至关重要的。

4.2 存储层面的挑战及联想凌拓存储解决之道

存储始终是一个中央存储库，存取所有的设计文件，并运行各种不同的EDA工具来处理数据。然而，随着芯片设计复杂度的提高，各种EDA工具的工作量也有所不同。如果没有足够的存储设计及优化，在高数据芯片设计环境中，性能瓶颈是源于存储。
下面列出的项目突出了一些主要的存储瓶颈在EDA应有程序环境以联想凌拓存储解决之前的简单描述。
• 计算服务器池（Server Pool）中运行以非线性的高存储性能增长：

建议半导体行业用户，建立基于联想凌拓存储可预知存储生产性能，例如典型的存储控制器+磁盘（全闪），可对应的计算服务器池CPU核数，或可对应的IOPS及带宽，或可对应的项目组数等。利用可预知存储生产性能，动态地横向扩展存储集群，统一集群命名空间建立和验证，支持不同型号的存储及磁盘介质。如单个文件系统仍无法满足业务要求，Flexgroup跨多个节点多个文件系统提供更高的NAS文件系统性能。

• 更高磁盘性能和全闪SSD的优化

联想凌拓存储独有专利技术，配合NVRAM日志功能，藉由硬盘区块的配置最佳化，可将大量的随机写入转为少量的循序写入，真正达到平行写入 (Stripe Write) 并减少磁头移动的次数和磁头移动的距离，加速档案存取和搜寻的速度。

同时，基于以上技术，ONTAP独特的WAFL文件系统恰好非常适合SSD硬盘的写场景，与传统的RAID写入方式不同，WAFL写入方式能够将存储设备所有硬盘的空间都利用起来，避免了热点盘的现象，也避免了传统RAID的写惩罚机制针对某颗SSD的超高磨损而带来的故障率升高。ONTAP针对全闪存储的SSD硬盘还有非常多的独特优化，这些优化使得FAS全闪存储能够在性
能和功能性上都领先于其他竞争产品，这一点也得到了市场本身和第三方权威分析机构的第一名的认可。

• EDA编译和仿真过程中，巨量的元数据操作如何提高系统响应时间

Flash Cache 是一种基于联想凌拓存储控制器（FAS或DM）上NVMe磁盘性能加速卡，可作为主内存或基本内存的扩展缓冲区。它主要用作读取缓存。Flash Cache 可以非常有效地为元数据和读取工作负载实现低延迟。由于 EDA 验证工作负载包含数百万个小文件、大量的元数据并需要进行大量顺序读取，Flash Cache 可以为其缓存元数据和数据，从而加快 I/O 请求处理速度，并减少后端磁盘访问次数。这样就可以提升整体 EDA 设计应用程序运行时的性能。它已经获得我们大多数 EDA 客户的一致认可。而联想凌拓厂家建议用户每个控制器上最小配置1TB Flash Cache卡用于EDA业务的元数据加速。

• EDA应用其实是一个巨量文件数的工作环境，如何保证文件系统一致性而不会数据掉失

联想凌拓存储独有专利技术利用存取速度较硬盘快一千倍的NVRAM内存，担任文件系统的日志，同时保护metadata及data的交易纪录，并加速写入的效率和反应时间、保证文件系统的一致性、保证写入的交易不会因断电而流失。

任何时刻文件系统都是处于一致性的状态，即使遇到不正常断电或不正常关机后，也不需执行硬盘检查，即可在复电后2 分钟内提供服务。
注：1995年5月提出专利申请，在1998年10月获得专利（专利号码：5,819,292），题目为「Method For Maintaining Consistent States of A File System and For Creating User-Accessible Read-Only Copies of A File System」，前半部分就是WAFL，后半部分就是快照 (Snapshot)。另一项专利于1995年6月申请，在1998 年9月获得专利（专利号码：5,948,110），题目为「Method For Providing Parity In a RAID Subsystem Using Non-Volatile Memory」，这就是如何利用NVRAM 来加速RAID，并保护 RAID 数据的一致性。WAFL 结合NVRAM、RAID、Snapshot 的设计难度极高，故从1992 年至今仍未有其它厂商可以做到。

• 老化文件系统不断删除和写入，磁盘花费更多的时间找到连续的自由空间及整理文件系统碎片。

EDA 业务特性，开始会有大量文件读取, 中间会有小文件读写与刪除, 最后会有大量读写与刪除，因为由计算服务器池（Server Pool）同时存取, 所以大量读写与刪除会同時发生, 若delete 响应时间不够及时, 可能导致timeout Delete queue 的限制改为volume, 而非node，Delete queue 高达100 万 (size >1TBvolume)

老化文件系统不断删除和写入，磁盘花费更多的时间找到连续的自由空间及整理文件系统碎片每周WAFL 会自动自我扫描检查每颗有资料的硬盘所有区块，检查的周期与时间长度亦可自行调整，于所定的时间内未完成时，也会在下次检查时继续未完成的部分。如此可以提早剔除将会故障的扇区，提供更安全、稳定的硬盘环境，更进一步降低风险。当然，系统可以启动CSC功能，只有存储有空闲性能，就启用CSC连续磁盘碎片整理功能。
注：全闪存储不存在碎片整理问题。

• 如何更高的磁盘利用率，重删及压缩功能：

由于EDA工作负载和文件的性质，ONTAP通过使用重复数据消除可以提供高达20%的效率，通过使用压缩可以提供高达30%的效率，总共节省了高达50%的空间。
联想凌拓存储全闪存储默认重删除/压宿都是打开的只有1%到2%的性能下降，尽可能的提高效率降低磨损率就是一个对于全闪存储来说非常关键的要求。联想凌拓存储系列全闪存储在推向市场的第一刻就具备了在线重删和压缩两个关键性数据效率工具。

• 如何保护EDA应用重要数据—快照，数据异地复制及双活

联想凌拓存储另一项最重要的特色就是Snapshot了，每个Snapshot都是一个consistency point，也是一个完整的只读文件系统，WAFL只要复制Root就可以非常快速的产生一份新的只读文件系统，同时原有使用中的文件系统所占用到的硬盘区块都会被锁定，任何要写入的资料都不能再覆盖这些被Snapshot过的硬盘区块，而是会写到新的、未被使用与未被锁定的区块。因为只复制Root，所以与真正的档案资料量相比，至少小了数百倍以上，因此不但非常节省存储空间，Snapshot的速度更是能够在数秒内完成1TB的快照。

同时，联想凌拓存储不需额外软件的协助即可传送有异动的硬盘区块，可针提供无距离限制的多对多和串联式的异步镜射复制系统，另外凌拓存储提供SAN+NAS全方位的两地三中心解决方案。

• 一些EDA作业可能会产生更多的I/O请求（包括读写），从而导致存储资源的瓶颈。识别和管理失控的工作和平衡存储资源的挑战

联想凌拓存储提控QoS功能，工作负载包括I/O操作和数据吞吐量，分别以IOPS和MBps为单位来度量：
• Storage virtual machines (SVMs)
• FlexVol® volumes
• LUNs
• Files
包括控制抢占资源的工作负载，管理不同租户不同应用要求，实时调整。
另外，存储能识别和管理失控的工作，EDA业务管理员能尽快定位及排除故障。

5.联想凌拓存储针对EDA的解决方案优势

联想凌拓存储是芯片设计公司使用的主存储。除了提供大量的存储空间，各种芯片设计的逻辑过程中，联想凌拓存储还提供以下功能，有助于缩短整体芯片的设计周期：
•性能
•横向扩展架构
•高可用性
•存储效率
•统一存储
•QOS
•数据保护

5.1 性能

联想凌拓存储能够处理任何类型的工作负载。NVRAM的独特组合和WAFL（Write Anywhere File Layout）和4K大小的一块文件系统加速的写入性能。在一个总的磁盘主轴足够数量的NVRAM和WAFL补充优化写性能进一步。这有助于EDA应用数据库和其他操作的各种不同的芯片设计，通常创建大量的小文件。联想凌拓存储独有专利技术，配合NVRAM日志功能，藉由硬盘区块的配置最佳化，可将大量的随机写入转为少量的循序写入，真正达到平行写入 (Stripe Write) 并减少磁头移动的次数和磁头移动的距离，加速档案存取和搜寻的速度。这提高了随机读写操作和存储空间的效率，同时提供高效备份到高计数的EDA应有程序环境的能力。
在每个联想凌拓存储控制器基于PCIe闪存缓存（FlashCache）EDA的工作量提高读性能和元数据加速功能。
理想情况下，EDA环境主要使用NFS从计算节点上存储卷。联想凌拓给你Linux®开源社区和RedHat Linux也有密切合作，为内核性能的提高，使Data ONTAP®高效整合。

5.2 横向扩展架构

联想凌拓存储集群Data ONTAP集群命名空间是一个新的扩展的架构，提供了所有的存储效率，如快照，数据远程复制、节省空间的克隆，自动精简配置，压缩，重复数据删除技术，网络负载均衡、FlashCache加速，FlashPool存储加带层和不间断的数据空间迁移（Volume move）操作。

这些集群Data ONTAP的能力，功能芯片的设计过程中可以运行不同的工作负载，如在一个集群命名空间建立和验证/模拟。同时，也可以有多个群集命名空间，可以运行多个芯片设计过程，作为安全的多租户在同一群集,而不会损害知识产权。

在单一的存储群集可安装程序运行的所有EDA的组件，配置存储空间和资源可以实现无缝升级扩展，不中断用户的应用，在计算服务器池（Server Pool）增加并发处理量同时，增加存储性能达到更高的整体系统性能。

联想凌拓高度推荐使用高端的所有闪存存储平台，如FAS系列(DM)或AFF(DMF)，以最大化每个节点中可用的RAM和CPU。

Figure8：Storage architecture for EDA based on NetApp clustered Data ONTAP.

5.3 高可用性

联想凌拓存储具有很高的正常运行时间与6个9可靠性，进一步提高了可靠性和灵活性在EDA的环境，并可提供第三方权威证明（IDC报告）。

•联想凌拓存储的高可用性（HA）集群对提供无缝故障转移，在任何情况下，硬件发生故障时不会造成任何中断，不会影响用户运行。
•RAID-DP允许有两个磁盘奇偶校验，RAID配置为一组提供更多数据的弹性对单或双磁盘故障。（RAID-TP保护3块磁盘同时故障）。在典型的EDA环境中，客户使用单个磁盘池。在RAID组中使用磁盘的最大数量（例如，28个磁盘的SAS磁盘），强烈建议有效率地使用可用的磁盘空间，而不是多个小型RAID组的集合。
•不间断的升级（NDU）。联想凌拓 Data ONTAP存储可以进行固件不间断升级。硬件故障，也可在存储控制器切换。此功能有助于提高存储系统的可用性，同时在存储系统上执行一些紧急和非例行维护活动。EDA工具在此过程中不会遇到任何中断。

5.4 存储效率

多年来，联想凌拓存储始终提供了强大的功能来提高存储效率。存储效率有助于提供高数据一致性和最大限度地减少恢复时间，而不会影响性能。
•快照。联想凌拓存储提供基于指针的快照副本，可瞬间创造快照保护。对性能几乎没有影响，快照副本不承担任何额外的存储空间。可以安排快照计划以创建用于存档EDA数据的副本保护。
•Thin Provisioning。精简卷在联想凌拓存储配置，安装在NFS配置默认thin provisioning。此功能减少了初始存储空间的消耗。
•Flexclone。联想凌拓提供了克隆技术，可以瞬间克隆卷/或文件而不消耗任何额外的空间。在VC环境下使用flexclone，它是一个强大的工具来克隆一个生产量快速测试，不影响母卷。在开发和测试程序完成后，克隆卷可以从其父卷中或断开，以作为生产环境中的常规卷使用。
注：重删及压缩的功能，建议在全闪存储系统（Ontap9.2）中启用，对性能几乎没有影响及更优的存储空间效率。

5.5 统一存储

联想凌拓存储提供多协议支持，例如，NFS，CIFS，FCP、iSCSI可以在同一个存储并存。一个EDA环境主要使用NFS，和在一些情况下，文件系统是在Windows用户CIFS使用。数据完整性是通过Data ONTAP完全保存时相同的文件系统同时提供NFS和CIFS访问。

5.6 QOS

如之前所述，一个典型的EDA环境，用户提交成百上千个并发工作队列。调度程序将作业发送到计算服务器池（Server Pool），它有数万甚至数十万个CPU Core来处理作业，从而产生大量存储在存储器中的文件。通过存储服务质量 (QoS) 保障，精细控制每种工作负载的性能，确保应用程序可预测性，助力实现规模化整合。确保存储集群内每一个项目的业务保证。所以QOS是针对一个大型混合EDA企业一个必不可少的功能。

5.7 数据保护

联想凌拓存储提供了高效的数据保护服务，这是嵌入在Data ONTAP，提供一致的备份档案，复制整个站点和灾难恢复。
•Snapmirror和SnapVault。联想凌拓存储提供数据保护功能将数据复制到一个不同的位置或一个灾难恢复（DR）网站数据中心。这两种技术都使用快照来执行后台的数据传输，而EDA卷则将数据提供给前端的计算服务器。
•Snaprestore。快照将文件或卷恢复到某个时间点，可以通过文件系统指针，在大量文件环境中快速指针恢复。

6.Storage Sizing 推荐

随着芯片设计在当今时代的日益复杂，正确的选择存储平台，可以处理足够的系统资源，响应计算机Pool的并发I/O请求是非常重要的。除了下面列出的所有最佳实践建议外，它是强制性的，随着的增长不断维护和管理文件系统。以下章节讨论了所需的最佳实践和定期维护的细节。

6.1 存储的架构和 Sizing

选择合适的存储平台，随着存储规模和配置不足，可能会导致潜在的存储瓶颈，导致性能下降的EDA应有程序工作量。具有多个内核和大内存占用的存储控制器是EDA应有程序工具的强烈要求。更快的串行访问SCSI（SAS）磁盘或SSD应始终用于设计，需要更快的响应时间。

Storage Platform Best Practices
• 用户建立应用可预知性能，选择大控制器，少节点数。
• 少aggregate，大aggregate, 磁盘 Data aggregate保留15%空间,启用CSC功能，文件系统碎片整理，全闪不存在碎片问题。
• SAS/SSD磁盘 Raid Group Size要在RaidDP(21+2或22+2)基础上配置
• FlashCache提升metadata与读写的响应时间,至少每个控制器１TB，如果控制器连接SAS磁盘越多，建议升级配置FlashCache的容量。
• 使用多个存储设备，多卷分布数据在不同存储设备，或采用Flexgroup功能，避免单控制器的限制
• 尽量保持卷的目录深度小于5。
• 卷的maxfiles默认值为每32KB对应1个inode。这可以增加到每4KB对应1个inode。
• 考虑开启no_atime_update与minra(避免read-ahead)，提升性能。
• 避免使用Qtree SnapMirror(QSM), 启用Volume SnapMirror备份数据。
• 可考虑存储ＱＯＳ功能，控制性能的输出．
• 可适当考虑升级Linux OS版本(RHEL 6.5 )

6.2 Data ONTAP

Data ONTAP 9和后来的版本是高度推荐使用EDA环境。在需要高度并发性的高文件计数环境中，改进的多线程和多任务存储能力将进一步提高作业处理和响应时间。
Data ONTAP Best Practices
Data ONTAP 9后应使用EDA的工作量，因为：
• 它提供了更多的并行网络线程来处理I/O请求。
• 它有更平衡的CPU利用率在所有的核心。
• WAFL和RAID层现在可以运行更多的异步线程并行。
• 文件数量限制在一个单一的体积进一步增加。
• 不再有任何子目录或硬链接限制。
• 它有助于顺利删除, 删除更均匀的后端在繁重的写工作负载。

6.3 存储网络

网络瓶颈的存储通常确定时，计算Pool访问一个以上的芯片设计在不同阶段的高层次的并发性。高网络利用率发生在尖峰期间的验证和仿真阶段，其中在网络流量的读取和写入的峰值分布在整个逻辑芯片设计过程的持续时间。在这些时刻，用户通常会遇到高CPU利用率的存储，从而触发高响应时间在网络上。
Storage Network Best Practices
• 在每个存储控制器上聚集至少两个网络接口，更高的接口数量总为更好的吞吐量和响应时间。
• 多个10gbe或更高的带宽连接需要的工作量所需的网络性能支持系统。不推荐使用VLAN集群来分割网络带宽。

6.4 Flash Cache

存储上的缓存层补充了EDA负载的I/O需求量。随机数据访问加大是磁盘的性能压力，基于闪存缓存提供更多的读I/O。
•Flash Cache提供额外的I / O读请求的基于闪存的高速缓存，而磁盘主轴有助于提高性能的写密集型工作负载。
•基本内存（DRAM）、闪存高速缓存和磁盘之间的数据的所有移动都透明地出现在应用程序中。
•建议使用Flash缓存中的默认设置（元数据和随机模式）。
•在以后讨论的某些场景中，缓存缓存中的大序列数据以及元数据和随机块有助于提高读取性能。
Storage Caching Best Practices
• 最低1TB闪存缓存建议每FAS控制器。
• 一个较大尺寸的闪存缓存设置可能会被推荐，这取决于单个控制器上芯片设计的数量，内存中的活动工作集大小，以及其他变量。
注：FlashCache不适用于全闪存储。

6.5 网络文件系统 (NFS)

几乎所有的EDA工作量访问后端存储控制器的文件系统基于NFSv3协议。
•NFSv3是一个无状态的协议，如EDA异步写入。
•NFSv3的客户端和存储发生在远程过程调用（RPC）之间的通信。
•红帽企业Linux（RHEL）6.X是最常见的Linux厂商支持的版本，大部分在半导体公司计算机Pool环境中使用。

File System Best Practice
• 近的内核版本的RHEL（rhel7.2或以后）建议改进的TCP协议栈优化。
• 适当的挂载选项，建议稍后，应使用计算节点。
• 保持目录结构尽可能平坦，减少目录的深度。
• 建议将文件系统扩展到多卷。这将导致更好的inode和目录文件利用每个卷上：
• 减少了Qtree开销，用于在不同的卷上分发文件系统
• 保持路径名短。长路径名产生额外的NFS查找、添加元数据量。查找目录结构中的文件也需要更长的时间。

Compute Node Best Practices

• Use the recommended mount options on the Linux compute nodes: vers=3,rw,bg,hard,rsize=65536,wsize=65536,proto=tcp,intr,timeo=600

• Set the sunrpc.tcp_slot_table_entries = 128; this improves TCP window size.

• Set the net.core.netdev_max_backlog = 300000; avoid dropped packets on a 10GbE connection.

7.存储优化

在执行前面提到的所有的大小调整工作之后，许多不同的应用程序或工具有不同的工作负载模式被添加到存储，这是共享的基础设施工作。为了适应这些不同的工作负载，一些知识的访问模式以及一些调整存储是必需的。所有上市后的调整信息是针对改善EDA工作量。

下面的列表是非常典型的一个EDA基础设施在客户网站：
• EDA构建和验证运行为单芯片设计处理在一个单一的数据空间。
• 在一个集合中会有多个卷。总是在一个单一的aggregate在控制器上。
• 在许多情况下，顺序读是在随机写后，伴随着一些大的删除。这种情况在验证阶段非常常见。
• 即使WAFL做了许多的工作，全部数据的条纹在磁盘，文件系统碎片化时间从较大的删除和快速连续的文件创建。

7.1 文件系统优化

文件系统可以随时保持分配低优先级的过程是不断整理，它可以在后台运行。建议的措施以保持硬盘池总利用率低于85%。
•一些自由空间需要暂时移动数据块到自由空间，并重写这些块完整和完整的条纹在磁盘上的连续位置。
•让文件系统的碎片整理不完整在后台运行。
•The continuous segment cleaning（CSC）介绍了Data ONTAP确实有助于凝聚删除块在池中自由使用后续写道。
•每卷使―no_atime_update选项将理由如下帮助（默认情况下禁用此选项）：降低CPU利用率为每一个NFS读请求。更新访问时间（时间）一个文件将脏块和快照拷贝消耗更多的块或转移更多的块SnapMirror结果。EDA的工作量大量阅读的工作量用SnapMirror备份/复制数据；启用这个选项将帮助。
建议使用下列存储选项来处理这种访问模式。

Data ONTAP Best Practices

• reallocate start –p /vol/<vol_name> - It is always recommended to start ―reallocate‖ when the new volume is created. The following options may also be set when the new volume is created:

• vol options /vol/volxxx read_reallocate on

• aggr options <aggr_name> free_space_realloc on

• vol options <volume_name> no_atime_update on

7.2 NFS 优化

NFSv3是最值得信赖的协议，到目前为止，我们的客户，还需要对存储的一些优化处理计算节点的NFS请求。
NFS流量控制。大多数存储专家熟悉流量控制在网络层的设置。然而，也有一些调整，可以在协议栈处理传入NFS请求存储，以减少一些节流：Data ONTAP可以一次处理预定数量的NFS请求。这些控件由分配给NFS的异步消息的数目控制。在某些情况下，单个客户端可以发送太多的NFS请求进行处理，可以使用所有的异步消息。这将影响其他客户谁想要发送NFS请求，将不被服务，直到一些异步消息被释放。最优值必须设置为存储限制的过程从每一个客户的NFS请求。
NFS Best Practices on 联想凌拓 Storage
• options nfs.sendq.max 128
• options nfs.ifc.xmt.high 64
• options nfs.ifc.xmt.low 16
TCP接收缓冲区大小。随着大量的计算节点访问文件从一个单一的控制器，TCP接收窗口大小或接收缓冲区可能会很快耗尽。该存储将不会接受任何进一步的TCP窗口的电线，直到接收缓冲区被释放。建议增加TCP接收缓冲区值。
NFS Best Practices
• options nfs.tcp.recvwindowsize 2097152
• options nfs.ifc.rcv.high 3145728

7.3 Quota 优化

在EDA环境中，实现用户和组配额是一个常见的场景。默认的用户和用户组的配额使用趋于在较慢的路径，从而增加kahuna utilization.。这影响写入性能。
Quotas Best Practice 建议将一个明确的配额输入在用户和组在/配额/配额文件的存储。

7.4 数据保护优化

在巨量文件数环境中，数以百万计的文件在一个单一的目录，SnapVault使用qtree SnapMirror（QSM）在后端引擎，它处理的数据传输量不同（VSM）SnapMirror。SnapVault始终是一个巨量文件计数较高环境利用的性能开销字节。这也影响了CPU的利用率。
Volume SnapMirror VSM不区分用户数据和元数据。它只是决定哪些块已经改变，并发送这些修改块到目的地。Backup/DR Best Practice
在一个high–file count环境中，大量的芯片设计都涉及到高性能，VSM建议用于远程备份。

8.Flexgroup性能的优化

EDA工作负载给存储系统带来了一系列独特的挑战，这主要是由于存储系统具有巨大的容量、高文件数和大量的元数据操作，以及对制造商的高性能要求。

• 容量

NetApp FlexVol卷在单个容器中提供高达100TB的空间。然而，在某些情况下，EDA工作负载可能需要超过这个数量。FlexGroup卷通过NAS协议为EDA工作负载提供了一个多字节容器，随着数据集的增长，该容器可以无中断地扩展或缩小。FlexGroup最大可支持20PB.

• 高文件计数环境

NetApp FlexVol卷在单个容器中最多支持20亿个文件。在某些情况下，这一数额可能不够。EDA文件系统布局可以包含每个目录的数千个文件，具有深度目录结构。NetApp FlexGroup卷可以在群集中的多个成员卷和节点上以指数方式增加文件计数，以提供可包含数千亿个文件计数的容器. FlexGroup最大可支持4000亿个文件.

• 性能

NetApp FlexGroup卷为高文件数、元数据繁重的工作负载（如EDA）提供多线程并行操作。通过将接收负载分散到多个FlexVol成员卷、多个网络接口和多个群集节点上，NetApp FlexGroup卷以可预测的低延迟提供高吞吐量和IOPS，这些延迟在规模上仍然表现良好。你需要扩大业绩吗？无中断地向群集添加更多节点。此外，在所有flash FAS中使用ONTAP和flash优化可以提高EDA工作负载的性能和密度。有关所有Flash FAS系统上EDA工作负载的性能验证，请参阅TR-4324。

• 简单

NetApp FlexGroup卷将容量、高文件计数处理和性能与一个简单、易于部署的容器混合在一个NAS命名空间下。数据存取和负载平衡中，由FlexGroup卷使用的ONTAP子系统自动处理，无需担心数据是本地还是远程放置。有关更多信息，请参阅TR-4557：NetApp FlexGroup卷–技术概述。

FlexGroup卷可以很好地处理工作负载，如图所示。
使用了以下配置：
•2节点AFF A700集群
•每个节点的单个800GB固态硬盘聚合
•FlexVol：单节点，100%本地
•FlexGroup：跨HA对，每个节点8个成员（总共16个成员）
工作量如下：
•GCC库编译，仅克隆操作（这些显示了FLexVol和Flexgroup卷的最高最大吞吐量）
•4台物理服务器
•客户机上的用户工作负载/线程从4到224
图FlexVolume克隆操作的最大实现吞吐量（读+写）与跨越2个节点的单个FlexGroup卷进行比较。注意，当工作量达到64个线程时，最大吞吐量达到了Flexvol卷的近5X，而没有看到卷看到的相同降级。

9.总结

随着芯片设计器件尺寸不断缩小，这意味着设计的复杂性和设计元素的数量大幅增长，对于高并发的EDA流程，如我们已经说明了优化存储可以极大地优化EDA工具的运行时间，从而提高生产力和缩减上市时间。本文做了一个非常详细的尝试：
• 了解EDA工作流和访问模式,
• 了解EDA应用层和存储层的挑战
• 建立一个已验证的工作负载，以确定可预知存储性能
• 优化的基础上，确定选用的联想凌拓存储
联想凌拓存储可以优化EDA运行的I/O性能，不同芯片的设计可以有不同程度的改进，适当的优化存储与定期文件系统维护可以显着提高仿真性能。更多的评估和验证其他EDA工具, 使用联想凌拓存储、共享、管理并存取设计文件，使用的不同阶段的芯片设计和制造工艺, 推动EDA行业的业务, 这实现两个最重要的要求:
•提高ROI

•更快的上市时间

江苏信瑞一芯科技有限公司是netapp的金牌代理商，如有业务需要洽谈，可搜索我们的官方网站与我们联系。