共计 7745 个字符,预计需要花费 20 分钟才能阅读完成。
进入个人电脑已有一年半,而直到现在,它的带宽优势才首次被 三星 充分发挥出来。本次 pceva 的是三星 980pro 的 1tb 版本,也是目前的最大型号,2tb 版本会在稍晚些时候上市。
首个 pcie 4.0 ssd
所谓满血状态,主要分两个部分:一是顺序读写速度用满 pcie 4.0 带宽极限;二是能够在高队列深度下充分发挥 4k 随机读写能力。三星 980pro 堪称是首个满血状态的 pcie 4.0 硬盘。
首先来看顺序读写带宽,他主要受到外部 pcie 接口以及内部闪存接口的共同制约。
早期的 pcie 4.0 固态硬盘(群联 ps5016-e16 方案)只能提供 5000mb/ s 的顺序读取速度,这是因为主控使用 800mt 闪存接口,800 x 8 通道再除以经验倍率(通常在 1.25 到 1.35 之间),最终可提供的带宽介于 4740mb/ s 到 5120 mb/ s 之间。e16 受限于闪存接口速率,无法更充分地利用 pcie 4.0 的带宽。而三星 980pro 使用 1200mt 闪存接口,理论带宽在 7111mb/ s 到 7680mb/ s 之间。
通常来说,pcie 4.0 的理论带宽为 8gb/s。但实际上 8gb/ s 只是物理层的电气传输能力,由于 128b/130b 编码的影响,会损失大约 1.538% 的带宽,所以 pcie 4.0 x4 实际可用带宽为:7.88gb/s。
此外还有更多的额外开销。数据以 tlp 信息包传输,其中包括了事物层添加的 header 和 ecrc 纠错码、数据链路层添加的 sequence number 和 lcrc 纠错码等等。而一个 tlp 包所能承载的有效数据量是有限的。
这部分有效数据(payload)理论上最长可以达到 4096 字节,不过通常它会受到设备以及主板支持的共同限制,多数情况下被限制在 256 字节。按照下图中的情况,我们可以计算一下数据包的效率是:256/(256 4 2 12 4 4)=90.8%。
用 7.88gb/ s 乘以 90.8%,结果是 7.15gb/s,也就是说,三星 980pro 的 7000mb/ s 已经非常接近 pcie 4.0 x4 的带宽上限。三星尚未宣布 980pro 2tb 版本的性能指标,我们拭目以待。
接下来看高队列深度下的 4k 随机读写 iops,它主要受到主控硬件支持以及闪存访问延迟两个因素的影响。
在 sata 时代,受 ahci 协议的影响,4k 随机读写 iops 通常在 100k 以内,也就是 10 万 iops。
nvme 协议针对闪存等新型非易失性存储介质进行了大量优化,理论上可支持最多 65535 个队列,每个队列支持 65536 长度,但实际上主控并不能支持这么多。好消息是技术在进步,从近几代三星 nvme 主控的发展可以看到,elpis 已经能够支持 128 个队列。不过我们目前没有其他主控的队列支持数据,无法进行更多的比较。
除了主控,闪存自身存取延迟也是一个重要影响因素。980pro 使用的三星第六代 v -nand 闪存相比上代产品的存取延迟降低 10% 以上,同时功耗也降低了 15%,从而可以更快、更高效地应对数据存取。
硬件拆解部分
980pro 使用了三星全新设计的 elpis 主控,支持 128 个队列,每队列可包含 64000 个命令,共计超过 800 万个命令,为 4k 随机读写效能的提升奠定了坚实的基础。另外,elpis 还采用了三星自家 8nm 工艺制造,相比同类主控的 12nm 工艺更为先进,在功耗控制上也会具备一定优势。
dram 缓存特写:三星 lpddr4(编号 k4f8e3d4hf-bgch),容量 1gb。三星是当前少有的集主控、dram、nand 设计制造能力于一身的企业,使用 lpddr4 作为 dram 缓存有助于降低整体功耗,减少发热。
nand 闪存特写:三星第六代 v -nand 3d tlc(编号 k9dugy8j5c-dck0),1xx 层堆叠相比上代 9x 层提升 40%,读写延迟降低 10%,功耗降低 15%。关于这代闪存的具体堆叠层数一直是一个谜,三星m6米乐安卓版下载官网上将其标为 1xx 层(即 100 多个层),所以我们采用这一写法。
三星 980pro 在增强散热方面的努力包括主控表面的镍涂层,以及 pcb 背面的由多层铜箔堆叠而成的散热标签。这些举措使得 980pro 可以无需接触外部散热片的帮助,就能在重负载使用下保持合理的温度,而不致过热限速。
可能有朋友会问,能加个散热片就解决的事情,有必要这样费力去优化吗?答案是肯定的,pcie 4.0 固态硬盘不仅应用在高性能台式机上,同样也会有在笔记本电脑(如英特尔 tiger lake 平台)中使用的需求,后者的安装和散热空间远比台式机恶劣。就空间限制来说,多数轻薄笔记本电脑的 m.2 安装位仅能容纳单面 pcb 设计的 nvme 固态硬盘,无论底部还是顶部均没有多余空间去安装附加的金属散热片。镀镍层可以帮助 980pro 的主控温度下降约 7 度,降温效果明显,同时不会影响空间兼容性。
980pro 是三星第一次在 pro 系列上使用 3d tlc 闪存。从读取效能来看,tlc(三星称 3bit mlc)闪存并未影响到 980pro 成为有史以来最快的三星 pro 固态硬盘,但一些玩家可能会对写入寿命有所疑虑。相比采用 3d mlc 闪存的 970pro,600tbw 的官标写入量低了一半,但环顾当代旗舰级固态硬盘,980pro 的 600tbw(未来 2tb 版本为 1200tbw)的写入量指标依旧属于第一梯队,只不过是 970pro 过于耀眼了。
根据三星的调研统计数据,5 年内 nvme ssd 用户写入量在 156tb 以内的占 99% 以上。并且 600tbw 的写入量指标是根据 jesd218 标准测试得出,实际闪存磨损程度还和写入使用方式有关(写放大不定)。并且 tbw 指标只是一个影响保修的指标,超出后并不会影响 ssd 的继续使用。从历史来看,三星主控的数据纠错能力强悍,即便在闪存磨损极为严重的情况下也有能力确保用户数据的完整,超期服役的案例有很多。在家用领域,对 980pro 的耐久度担心是没有必要的。
测试平台及信息识别:
测试平台:
cpu:amd ryzen 9 3900x / ryzen 7 5800x
主板:技嘉 x570 aorus elite wifi
内存:hyperx fury ddr4 3200mhz 16gb
硬盘:建兴 zeta 256gb(系统盘)
三星 980pro 1tb(fw:1b2qgxa7)
系统:windows 10 20h2
驱动:samsung nvme driver 3.3.0.2003
设置:除特别说明以外,关闭 aspm 及 apst 节能
本次评测在同个平台上使用到了两个 cpu,一方面是因为时间有限,我们不得不赶在 ryzen 7 5800x 可用之前先完成部分测试,另一方面 ryzen 5000 上市时间不长,个别测试软件还存在一些小问题,所以我们保留了部分早些时候在 ryzen 9 3900x 上测得的数据。
crystaldiskinfo 信息识别:
crystaldiskinfo(cdi)是通用的固态硬盘 smart 信息检测工具,三星 980pro 具备和其他 nvme 固态硬盘相同的 smart 定义,简单的信息识别可以无需借助三星 magician 工具箱软件。
smartmontools 信息识别:
smartmontools 是一个开源工具软件,可以识别 nvme 固态硬盘的温度限制信息以及 apst 预设,这些信息同 nvme 固态硬盘的节能及热管理策略有关,下文中会有进一步的解读和测试。
nvme 在发展的过程中不断加入各种先进节能和热管理特性,通过 smartmontools 和 aida64 对 980pro 的识别结果整理如下。
三星 magician 工具箱:
6.2 版本的 magician 工具箱具备全新的界面,但左侧功能菜单有部分尚未完成汉化。
工具箱自带的测速功能可以用于验证 980pro 的顺序读写性能,但随机读写 iops 由于测试算法的原因,不能充分展现 980pro 的全部性能。1000k iops 的正确测试姿势会在下文中介绍。
三星 magician 提供了创建可引导 u 盘版工具箱的功能,用以实现对 ssd 的安全擦除。在挂副盘并且安装了三星 nvme 驱动程序的前提下,也可以通过 ochkin vadim 编写的 nvme-se 工具在 windows 系统内实现。
encrypted drive 提供了 tcg opal 加密功能开关,如果你希望实现 edrive(硬件加速的 bitlocker),则需要提前打开它,然后对 ssd 进行一次安全擦除,并进行全新系统安装。由于时间关系,pceva 评测室本次没有尝试。
上方的 psid revert 功能可以利用产品标签上的 psid(下图红色圈内所示)解除 980pro 的加密状态,并删除全部数据。
基准测试:
基准测试 1:理论带宽测试
三星 980pro 的性能指标是以 iometer 1.1 进行测试的,为了测试方便,多数朋友会用 crystaldiskmark 来检验。我们需要使用 crystaldiskmark,并对测试参数进行一些修改,顺序读写的队列深度加大到 128,4k 随机读写修改为 q32t16,即可得到以下成绩:顺序读取 7129.3mb/s,顺序写入 5164.1mb/s,超过官标 7000/5000 mb/ s 性能指标。
4k 队列随机读写带宽换算后相当于 1039800/1082675 iops,超过官标的 1000k iops 指标。4k 单线程随机读写带宽换算后相当于 23842/66475 iops,同样超过官标的 22k/60k iops 指标。如果大家在测试中无法实现官标性能,可能需要换一颗 cpu 试试,最好是单 ccd 的型号,尽可能降低核心间延迟。此外,cpu 手动超频并不总是对存储性能有帮助,某些情况下会起到反作用。amd 锐龙的机制同英特尔平台有很大不同,c state 等节能特性并不是简单的一关了之,此外电源计划也会影响到测试成绩,复杂性较英特尔平台高出许多。
基准测试 2:pcmark 8 测试
三星 980pro 在 pcmark 8 存储性能测试中获得 5099 分,比采用群联 ps5016-e16 主控方案的紫光 p400 2tb 高出 20 分之多。由于测试平台的差异,这里不能直接同英特尔平台上的成绩直接对比。
在英特尔 core i9-9900k 测试平台上,三星 980pro 以 pcie 3.0 速率工作,pcmark 8 存储测试得分为 5114 分。小编非常期待明年第一季度的英特尔 rocket lake 平台,cpu 节能特性更容易控制的英特尔平台在对延迟敏感的存储测试中通常会有更好的表现。
基准测试 3:pcmark 10 完整系统盘基准
pcmark 10 完整系统盘基准针对当代最新固态硬盘的广泛测试,涵盖了系统开机启动、adobe 设计套件应用、office 办公套件应用、图片 /iso 文件拷贝复制、多个游戏加载过程等测试内容。测试需要至少 80gb 的硬盘空间,单次测试产生的写入量达到 204gb,复杂度超过了 pcmark 8 存储测试。在这个测试中三星 980pro 1tb 的成绩更是大幅超越采用群联 ps5016-e16 方案的紫光 p400 2tb,领先幅度高达 50% 以上。
需要指出的是,目前 pcmark 10 在 ryzen 5000 处理器上存在一些兼容性问题,会严重影响测试结果。故本测试的数据基于 ryzen 9 3900x,和紫光 p400 相同。
基准测试 4:温度压力测试
三星 980pro 具备两个温度传感器,drive temperature 温度数据来自闪存颗粒,也是 crystaldiskinfo 和工具箱软件直接展示的温度。drive temperature 2 第二温度需要使用 hwinfo64 等软件读取,它是 elips 主控的温度数据。
一般来说,主控芯片能够承受近 100 度的高温,而非车规级的 nand 闪存只能承受不超过 85 度的温度。由于主控的发热量较闪存芯片更高,所以三星 980pro 将电源管理元件置于主控和 nand 闪存颗粒之间,尽可能拉开二者的距离,尽量避免 nand 闪存受到主控的影响而过热。pcb 背面的多层铜箔散热标签对准闪存颗粒而非主控,大约也是出于照顾闪存温度限制的原因。虽然车规级闪存能够承受高达 105 度的工作环境,但通常会有性能等方面的限制,并不符合家用固态硬盘的需求。
本测试在关闭一切 ssd 节能、无主动散热措施的条件下进行,测试时室温 22 度。温度压力测试使用 iometer 进行,测试方法为 128kb qd128t1 顺序读取,每秒记录。利用 hard disk sentinel 和 hwinfo64 查看温度变化。经过 10 分钟持续满载之后,三星 980pro 的默认温度度数为 64 度,距离 85 度限制尚有很大距离,未触及温度上限。
iometer 记录的读取速度数据也表明,测试过程中没有过热限速事件发生。
由于北方已经入冬,环境温度比夏季低很多,我们没能触发 980pro 的温度管理。据三星提供的资料显示,980pro 在温度管理上相比上代产品也有很多改进,在动态热防护(dtg)介入之后,读写性能相比 970evo plus 更高。
980pro 主控的动态热防护技术可以避免 ssd 工作在过高的温度下,保障硬件和用户数据的安全。如果你依然不放心在无金属散热片的情况下高负载使用对性能的影响,可以通过三星 magician 工具箱查看 980pro 的 smart 信息,其中的 warning composite temperature time 和 critical composite temperature 的数据为零,表示没有发生过 dtg 介入和限速的事件。
基准测试 5:nvme 节能特性
技嘉 x570 aorus elite wifi 主板的 bios 中没有提供 pcie aspm 节能设定,默认就是开启状态。要启用深度的 l1.2 节能,台式机需要在 windows 电源选项中将 pci express- 链接电源管理修改为“最大电源节省量”。笔记本电脑在未接 ac 电源时默认就会开启它。
apst 自动电源状态转换是 nvme 协议提供的另一种节能特性,共有 3 个活动状态和 2 个不活动状态。根据微软的信息,apst 会根据电源选项设定而有不同的作用机制,较低功耗的电源设定倾向于允许 nvme 固态硬盘进入更深度的节能状态。
结合我们通过 smartmontools 识别到的 apst 预设,除高性能电源计划外,三星 980pro 都能在闲置时间条件具备后进入到最深的 ps4 不活动电源状态,功耗低至 35mw,若同时进入 aspm l1.2 状态,功耗进一步降低到 5mw 以内。
在 22 度室温、无主动散热措施条件下,三星 980pro 的待机温度从关闭节能前的 29 度下降到 26 度,主控温度从关闭节能前的 36 度下降到 25 度,效果出色。
三星 980pro 的节能表现十分出色,当然用户还希望在节能降温的同时,更好地维持性能不下降。我们将 aspm 功能打开、使用平衡电源预设(200ms 超时进入,15ms 进出延迟限制)。crystaldiskmark 测试结果,仅有 4k 单线程随机读取略低,影响不是很大。
pcmark 8 存储测试完全没有受到影响,说明 980pro 在日常使用中能够很好地兼顾节能与性能发挥。
进阶测试:
进阶测试项目 1:slc 缓存及过半盘使用性能
三星在 980pro 上启用了全新的 turbowrite 2.0 智能 slc 算法,将 slc 缓存的容量提升了 5 倍。对于 980pro 1tb 来说,它具备基础的 6gb 固定 slc 缓存(位于 op 预留空间,始终可用),和额外的 108gb 动态 slc 缓存(临时借用未使用的空白闪存空间),总 slc 缓存容量达到了 114gb。按照三星提供的数据,980pro 在 30 秒内可写入 131gb 数据,是 970evo plus 及 970pro 的两倍左右,爆发写入能力优势显著。
从上图中我们还可以得到一个信息,970evo plus 的缓存内写入速度高未使用 slc 缓存的 970pro,这解释了在一些测试项目中为何 tlc 闪存的 970evo plus 能够战胜 mlc 闪存的 970pro。智能的 slc 缓存算法能有效地提升 ssd 性能表现,我们不应从内心中去抵触它。
hdtune 文件基准提供了一个 slc 缓存容量的简易测定方法,确认了空盘状态下 980pro 1tb 拥有总计 114gb 的写入缓存。由于测试方法的原因,hdtune 文件基准测得的读写速度可能与理论最大带宽有一定差距(队列深度不够)。
利用 iometer 向盘内填充 465.5gb 的不可压缩数据后,重新测试 hdtune 文件基准,50% 空间使用率下依然有 114gb 的写入缓存可用:
crystaldiskmark 测得的半盘性能基本无衰减:
pcmark 8 存储测试表明,半盘使用率下 980pro 的使用性能无衰减:
根据三星提供的数据,tubowrite 2.0 始终尝试提供 108gb 的动态 slc 缓存,当 ssd 中的可用空白块不足(少于 108×3=324gb)时,动态 slc 缓存将不可用。这里提到的少于 324gb 空间,指的是包括 op 预留空间在内的空白闪存容量,而非格式化后盘内剩余的用户可用空间。也就是说,直到盘内空间使用超过 700gb(盘内剩余 231gb 左右)才会禁用动态 slc 缓存,只余 6gb 的固定 slc 缓存。实际上,我们通过实际测试发现,在盘内填充 701gb 数据之后,盘内空间使用率达到 75%,此时依然有超过 12gb 的 slc 缓存可用。
进阶测试项目 2:4kb qd32 随机写入离散度测试
无文件系统下使用 iometer 进行 128k qd32 持续写入 30 分钟。slc 缓存用尽之后,写入速度经历了短暂低于 2000mb/ s 的过程后,很快又恢复到 2000mb/ s 以上。
结束后空闲 15 分钟,然后改用 4k qd32 随机写入 10000 秒并每秒记录。
最后 500 秒平均 iops:64174。波动不大,离散度表现非常出色。
进阶测试项目 3:pcmark 8 扩展存储测试之性能一致性部分(稳定态家用环境性能)
这个测试主要是给家用最恶劣环境下的性能参考(全盘不留任何剩余空间,禁用了 windows 文件系统缓存跑纯 raw 模式)。由于测试时间紧张,本项成绩基于 ryzen 9 3900x,和对照用的紫光 p400(群联 ps5016 方案)使用相同测试平台。
3d tlc 闪存没有阻碍 980pro 成为我们测试过的所有 ssd 中,抗压能力第二强的产品——仅次于傲腾 900p。考虑到傲腾 900p 是一款使用 3d xpoint 闪存、略带奢侈属性的产品,三星 980pro 的性价比显然更高。
总结:
pcie 4.0 不仅给固态硬盘带来了广阔的性能提升空间,也为 pc 游戏架构带来了新的变革机会。微软提出的 directstorage 技术可以借助 pcie 4.0 固态硬盘的超高读写带宽,实现部分类内存应用,在未来的 8k 材质贴图时代能够对游戏性能产生深远影响。
凭借 980pro 的出色发挥,三星重新定义了高性能固态硬盘。elpis 主控从制造工艺、队列深度支持等方面出发,提升了数据吞吐能力并改善了发热控制。第六代 v -nand 闪存提高堆叠层数的同时进一步降低延迟和功耗,充分展现了三星在全硬件生态系统中的强大实力。
pceva 的评测较其他媒体晚一些,因此有机会用上本月新上市的 zen3 架构锐龙平台,从测试成绩来看,三星 980pro 在家用领域发挥出了堪称全能的表现,常规理论读写速度以及实用效能创造了多个新纪录。明年第一季度,英特尔首个支持 pcie 4.0 的桌面平台 rocket lake 也将问世,将为 980pro 带来更为广阔的应用舞台。(转载)
文章剩余 50%