相信不少朋友已经把自己的电脑升级到Win10了,排开交互界面和功能不谈,Win10集成的DX12对于游戏玩家来说,吸引力还是挺大的。因为根据微软的演示,即便不谈新特效,单是执行效率,就相对DX11提升了数倍之多。不过,微软的官方演示也只是一面之词,到底实际情况如何呢?不久前,FutureMark在新版的3DMark中增加了一项Driver Overhead测试,专门针对DX12的API性能进行测试,这也可以让我们对DX12的性能提升有个直观的概念了。
Windows10发布这么长时间了,但DX12的测试程序至今为止寥寥无几,除了FutureMark新推出的“API开销功能”测试和基于UE4引擎的DX12演示DEMO外,玩家们可能还找不到其他可供使用的DX12程序。另外,“API开销功能”和UE4 DX12演示DEMO主要针对的还是DX12在效率方面的提升,而并不是画面特效的增加,所以只是想满足一下眼球的朋友,再等等吧。当然,在这之前,我们先来体验一下DX12带来的超高执行效率也是不错的。
要想完美支持DX12,这些条件要具备
▲并不是所有版本的Win10都集成DX12,最好是运行Dxdiag确认一下
▲驱动程序模型是WDDM2.0才能支持DX12,这里也可以看到9系N卡可以支持DX12.1
兼容和完美支持DX12是不同的两个概念,简单点说,现在的主流显卡都可以兼容DX12,但要完美支持DX12全部特效,就必须是GCN1.1及以上的A卡或者是GeForce 900系列的N卡。当然,即便只是兼容DX12,也一样可以享受DX12带来的效率提升。
那是不是只要显卡OK了就行?当然不是。除了显卡方面要支持外,驱动程序、操作系统以及程序本身都是有要求的。驱动程序方面,NVIDIA、AMD和Intel都已经更新了显卡驱动,大家只要用最新版就OK,实在不想更新,查看一下驱动程序是否是WDDM 2.0也可以(运行Dxdiag就可在显示页面下看到);系统就不用说了,目前只能用Win10(至于把DX12剥离出来用在Win7上是否完全没问题还不得而知);程序方面,3DMark要更新到1.5.915才能在正式版的Win10中正常使用API开销功能测试项目。
“API开销功能”到底测的是啥?
其实FutureMark官方的说明已经很清楚,API开销功能测试项并不适用于不同显卡之间对比性能,它主要考查的是系统在不同API下对GPU绘图操作的调用效率,效率越高的API,可以在消耗相同系统资源的情况下调用更多的绘图操作。
整个测试的原理也很简单,就是一直增加绘图操作的调用,直到画面更新帧速降到30fps为止,记录此时调用了多少绘图操作,越多则证明API的执行效率越高。此项测试包含了DX11单线程、DX11多线程、Mantle(只支持A卡)和DX12一共4个子项测试,各种API的执行效率差异一目了然。
实测!DX12效率高得吓人
▼测试平台
处理器:Intel Core i7 4770K
主板:华硕B85M-G PLUS
内存:金士顿DDR3 1600 4GB×2
显卡:GeForce GTX970;GeForce GTX760;核芯显卡
硬盘:金士顿HyperX SAVAGE SSD 240GB
显示器:DELL U2410
电源:航嘉MVP600
1、高端独立显卡实测
对于GTX970这样的高端显卡,DX12带来的效率提升十分惊人
但是多线程的DX11,得分就已经相对于单线程DX11翻了一倍,但用上DX12之后,这一倍的差距就是个笑话了——DX12的每秒绘图操作调用超过160万,比多线程DX11模式下快了6倍多!当然,N卡不支持Mantle,这一点大家其实可以不用在意,毕竟DX12是所有主流显卡都能享受的,有了DX12谁还在意连AMD都不准备再继续玩下去的Mantle呢。
另外,从图上右边的曲线可以看到一个有意思的现象,使用DX12时,CPU温度在中间反而最低,后来才慢慢升高。这其实可以证明,DX12在负载已经达到DX11环境下的极限时,对CPU的压力反而还要低,后来因为DX12下画面帧速降到30fps用的时间更长,CPU的温度才变得更高——这也证明了DX12在同样负载的情况下,对系统资源的占用更少。
2、上一代的主流独显实测
GTX760作为上一代显卡,即便不能完全支持DX12特效,也能享受DX12的高效率
我们知道9系列的N卡是可以完美支持DX12.1的,而7系列的老显卡就只能是兼容DX12了。不过这没有关系,从测试结果来看,GTX760也可以享受DX12的高效率,而且提升幅度比9系显卡还要高,达到了11倍!当然,GTX760的多线程DX11模式比单线程DX11模式本身也快不了多少。
从曲线来看,GTX760的表现和GTX970有些不同,它是GPU温度在测试中段出现降低,而CPU温度比较平稳,看来GPU架构对于DX12的效率影响还是比较明显的。
3、入门级的核芯显卡
核芯显卡也有两倍以上的效率提升
虽然和主流独显比起来,核芯显卡的性能要弱很多,但也从DX12中获得了好处——即便它也不能完美支持DX12所有特效。在DX12模式下,核芯显卡也获得了两倍以上的效率提升,得分比GTX970的单线程DX11模式还高,这的确非常可观。
曲线方面也很好解读了,毕竟核芯显卡是在CPU之中的,所以两者的温度曲线几乎是重合的,而温度也是呈现平稳上升的势头,整体表现比较稳定。
总结:
从测试来看,DX12在执行效率方面的提升的确非常明显,这可能归功于它对多核心CPU、GPU的进一步充分利用。不过,需要说明的是,API开销功能测试并不能用来简单地衡量显卡性能,毕竟这只是在考查绘图操作的调用,并不涉及各种图像特效、材质、贴图以及显存占用的部分,而这些因素对于DX12游戏运行速度的影响更大。
因此,在将来的DX12游戏中,你可能会发现它们的硬件要求依然还是很高,主流显卡在高画质模式下跑起来依然不轻松,但你也会注意到,相对于DX11来说,同样画质的情况下,DX12的游戏在场景细节方面的复杂程度会有明显的提高,这也是升级DX12的价值所在。
特别体验:采用UE4引擎的DX12 DEMO
由CryZEN基于UE4引擎制作的DX12DEMO正式上线了,我们也可以提前体验一下DX12游戏的效果。
在使用GTX970、1920×1080P分辨率的情况下,DEMO的运行速度会稳定在60fps,可见其已经锁定了最大帧速,但在DX11模式下运行时,帧速最低会掉到40fps左右。使用GTX760时,也可以运行DEMO(可见其不是强制要求DX12全特效支持),速度在50~60fps范围内,也还算流畅,偶尔有微小的卡顿。当然,这里我们还试了一下核芯显卡,居然也能运行,但是除了画面特效几乎全无外,运行速度也是以0.Xfps来计算了,这速度已经毫无意义了。
更新动态
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]