Unity Shader着色器优化-程序员宅基地

Unity Shader着色器优化

https://mp.weixin.qq.com/s/rtVJDt0m4aGbigWadEZgXA

 

对游戏开发者而言,着色器长久以来就是游戏开发中的重要部分,在Unity中编写并实现着色器的过程直观且高效,优秀的着色器还可以创造非常精美的游戏画面,同时保证极高的性能。今天将由Unity的技术工程师张陈渊来分享如何对Unity Shader着色器进行优化。

 

我们在Unity中创建Shader着色器的时候,会有四个选项:

  • Unlit Shader(无光照着色器):它是最基本的Vertex Shader(顶点着色器)和Fragment Shader(片段着色器)。

  • Image Effect Shader(图像特效着色器):适用于屏幕效果的Vertex Shader(顶点着色器)和Fragment Shader(片段着色器)。

  • Surface Shader(表面着色器):它更抽象一些,隐藏了Vertex和Fragment函数,暴露Surface函数作为替代,内部实现了一完整的光照模型。

  • Computer Shader(计算着色器):利用GPU的并行特性,为我们提供单纯的数据计算,可以与渲染管线无关。

 

除了Computer Shader外,另外三种并没有本质的区别。而在书写Unity Shader时,有一些写法会影响到执行效率。

 

[Gamma]与[Linear]指定,当颜色空间配制为Gamma时,对属性变量指定为[Gamma]和[Linear]都是无效的,只有当颜色空间配制为Linear时,指定才有效。所以当我们我们需要将一个Vector做为颜色使用,在Linear颜色空间下,指定其为[Linear]是比[Gamma]要高效的,因为如果指定为[Gamma],Unity会在CPU端做一次转换计算。

 

[NoScaleOffset]可以为我们省掉一个变量的分配,如果不需要用到纹理Tiling和Offset,请使用[NoScaleOffset]。

 

 

 

属性里面还有一个PerRenderData,如果有一个物体,我们进行渲染一百次,是同一个材质,但是我们有时候又需要这一百个物体显示为不同的颜色,那么怎么做?一种方法是顶点色这样做,但是这种方法不是特别好,我们还有一种方法可能是直接在材质属性里面加一个颜色,然后每个材质设不同的颜色。

 

如果要为每个材质设不同的颜色,Unity会帮助你创建一百个这样的材质,相当于你渲染一百个物体,每个物体颜色不一样,所以直接设置的时候,会帮助你创建一百个材质,这对于GPU来讲会影响,但是更重要是内存方面,会有一百个材质的内存开销,这是一个最大的瓶颈。所以我们引入了PerRenderData的这么一个属性的控制,它可以帮你把这个数据。例如:Color颜色,我们不需要将其画到材质里面,而是通过Render可以设置。

 

现在介绍一下Tags,Tags指定渲染顺序,告诉引擎如何以及何时将其渲染。Unity提供给我们一些默认的渲染队列,每一个对应一个唯一的值,来指导Unity绘制对象到屏幕上。这些内置的渲染队列被称为Background, Geometry, AlphaTest,这些队列不是随便创建的,它们是为了让我们更容易地编写Shader并处理实时渲染的。

 

下面是队列的描述:

  • Background:队列通常被最先渲染。

  • Geometry:默认的渲染队列。它被用于绝大多数对象。不透明几何体使用该队列。

  • AlphaTest:通道检查的几何体使用该队列。它和Geometry队列不同,对于在所有立体物体绘制后渲染的通道检查的对象,它更有效。

 

我们优化的时候对于不透明的物体不需要从后往前画,例如:很远的山或者背景,作为Background,前面作为Geometry,其实前景应该先画,然后再画后景。

 

有时候Unity处理的比较粗糙,更多时候需要大家自己进行控制。半透明必须从后往前画,这里没有太多办法进行优化。DisableBatching建议大家不要开启,默认的情况是不开启的。

 

ForceNoShadowCasting,例如:当我们画不透明的物体,需要替换半透明的物体,但是半透明的物体没有阴影,你可以更改Shader代码让它不投射阴影,直接加上ForceNoShadowCasting就可以了。

 

GrabPass,我们需要抓缓冲图有二种方式,如下图所示。

 

 

这二种方式的区别是很明显的,第一种方式是比较低效的,因为GrabPass调用的时候必定会进行抓取的操作,所以没次都是不同的。但是下面比较高效,一帧里面最多只执行一次,就是第一次使用会执行,后面不会执行。这个根据大家的实际的应用进行选择。

 

Render State,以前直接写图形程序的时候可能会比较关注怎么设置渲染状态,当它有变化的时候我们需要设置,没有变化时候该怎么处理?

 

Unity引擎是这样处理的,它把渲染状态缓存,缓存的作用就是为了不要频繁的切换,因为会判断当前这个状态和上一次的状态是不是相同?如果是相同,不需要调用图形API的接口,因为接口调用也有一定的消耗。那么这里可以引出一个优化点,如果渲染状态频繁的切换,那么起不到优化的作用。

 

所以我们写Shader的时候,尽量不要让这些连续的,不要有太多的渲染状态,尽量保证是少的,这样优化作用是大的。例如:AAA连续和BBB连续画,这样的效率高于AB间插的渲染。

 

Alpha Testing,大家知道在移动端,这是限于硬件的机能限制,尽量不要开启,在移动端开启,它的性能会比较低。

 

Color Mask,我们在移动端也尽量不要开启,这是固定的,大家一定要记住,因现在受于移动端的限制,PC端没有这个限制。

 

Surface Shader优化是比较难的,这里统计了一下我们能够做什么?我们基本可以做这些事情。默认情况下Surface Shader其实是开启了所有的计算,我们需要关闭或者模拟一些计算来达到一个优化的目的。

  • 首先是Approxview,它从View Direction Normalized移到Vertex Shader进行计算。

  • 其次是Halfasview,是使用光照方向和视角方向的中间向量替代一个视角方向,如果大家对比效果,觉得二种比较下来差不多,就可以选择优化过的效果。

  • Noforwarddadd,如果只有一盏像素光,你可以开启这个选项。

  • 最后是环境光,我们可以关掉一个环境光,因为关了之后有一些优化的计算,这里优化强度比较大,但是光照损失也是比较大,如果觉得效果可以接受,就可以关掉它。

 

变体优化是一个比较重要的点,因为很多人觉得Shader很占内存, 上百兆占用都有可能。小的话20多兆,达到上百兆肯定是不行的,那么我们需要查原因,到底什么东西导致我们的Shader变得这么大。

 

Unity提供另外一个关键字Shader Feature,它只会把使用的编译到包里面,而不会把没有用的编译里面。Multi_compile则会产生所有的变体。收集变体时需要注意,使用Shader Feature的方式,我们需要创建材质去进行变体的收集,材质需要序列化到场景中。

 

最后讲讲Shader的代码优化,我个人觉得它可优化的空间不大,空间大的地方在哪儿?我们思考优化这些最后的效果,思考这些数据是不是真的应该去进入了渲染管线?这是重点。进入渲染管线的数据优化之后,我们再做Shader优化就是锦上添花的事情。

 

首先我们CPU的软件裁减是不是高效且正确?当然我们会使用Unity的裁减功能,或者可以自己写。当有Over Draw时,渲染顺序是不是可以再优化 。例如:远处的阴影是不是真的需要开启?分辨率可以再小一点吗,最后一个全屏特效做的次数,大家讲的Bloom次数非常多,可不可以减少一些?或者其它的全屏特效可不可以集中一次把它做完。这些事情我们思考之后已经优化了很多效率。

 

最后我们可能需要针对代码去进行优化。那么代码优化我们需要利用一些工具做,英伟达的工具,iOS我们会使用Xcode,安卓有很多或者高通提供的工具我们都可以使用。

 

我们在代码优化的几个重点:

  • 我们要保证效果的前提下,尽量把计算放在Vertex Shader 。

  • 我们尽量不要写多pass SubShader。

  • 我们善用LOD,我们Mesh有LOD,纹理有Mipmap,Shader也有LOD。GPU执行二个Float的乘法和执行二个Vector4的乘法效率是一样的。

  • 少用分支, 还有一些内置函数,不建议自定义实现,我们可以使用提供的函数,那些是经过优化的。

  • 最后是精度问题,Fixed,Half、Float,不同的设备上它的性能不一样,我们尽量移动端使用一些低精度的数据。PC端这三种是没有什么区别的。

 

Unity Shader着色器优化需要注意的重点内容就为大家介绍到这里,希望每个开发者都能创建出高效果的Shader。

 

更多Unity着色器相关内容尽在Unity官方中文论坛(UnityChina.cn)!

posted @ 2018-06-19 12:13 00000000O 阅读( ...) 评论( ...) 编辑 收藏
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/OnafioO/article/details/86625017

智能推荐

JWT(Json Web Token)实现无状态登录_无状态token登录-程序员宅基地

文章浏览阅读685次。1.1.什么是有状态?有状态服务,即服务端需要记录每次会话的客户端信息,从而识别客户端身份,根据用户身份进行请求的处理,典型的设计如tomcat中的session。例如登录:用户登录后,我们把登录者的信息保存在服务端session中,并且给用户一个cookie值,记录对应的session。然后下次请求,用户携带cookie值来,我们就能识别到对应session,从而找到用户的信息。缺点是什么?服务端保存大量数据,增加服务端压力 服务端保存用户状态,无法进行水平扩展 客户端请求依赖服务.._无状态token登录

SDUT OJ逆置正整数-程序员宅基地

文章浏览阅读293次。SDUT OnlineJudge#include<iostream>using namespace std;int main(){int a,b,c,d;cin>>a;b=a%10;c=a/10%10;d=a/100%10;int key[3];key[0]=b;key[1]=c;key[2]=d;for(int i = 0;i<3;i++){ if(key[i]!=0) { cout<<key[i.

年终奖盲区_年终奖盲区表-程序员宅基地

文章浏览阅读2.2k次。年终奖采用的平均每月的收入来评定缴税级数的,速算扣除数也按照月份计算出来,但是最终减去的也是一个月的速算扣除数。为什么这么做呢,这样的收的税更多啊,年终也是一个月的收入,凭什么减去12*速算扣除数了?这个霸道(不要脸)的说法,我们只能合理避免的这些跨级的区域了,那具体是那些区域呢?可以参考下面的表格:年终奖一列标红的一对便是盲区的上下线,发放年终奖的数额一定一定要避免这个区域,不然公司多花了钱..._年终奖盲区表

matlab 提取struct结构体中某个字段所有变量的值_matlab读取struct类型数据中的值-程序员宅基地

文章浏览阅读7.5k次,点赞5次,收藏19次。matlab结构体struct字段变量值提取_matlab读取struct类型数据中的值

Android fragment的用法_android reader fragment-程序员宅基地

文章浏览阅读4.8k次。1,什么情况下使用fragment通常用来作为一个activity的用户界面的一部分例如, 一个新闻应用可以在屏幕左侧使用一个fragment来展示一个文章的列表,然后在屏幕右侧使用另一个fragment来展示一篇文章 – 2个fragment并排显示在相同的一个activity中,并且每一个fragment拥有它自己的一套生命周期回调方法,并且处理它们自己的用户输_android reader fragment

FFT of waveIn audio signals-程序员宅基地

文章浏览阅读2.8k次。FFT of waveIn audio signalsBy Aqiruse An article on using the Fast Fourier Transform on audio signals. IntroductionThe Fast Fourier Transform (FFT) allows users to view the spectrum content of _fft of wavein audio signals

随便推点

Awesome Mac:收集的非常全面好用的Mac应用程序、软件以及工具_awesomemac-程序员宅基地

文章浏览阅读5.9k次。https://jaywcjlove.github.io/awesome-mac/ 这个仓库主要是收集非常好用的Mac应用程序、软件以及工具,主要面向开发者和设计师。有这个想法是因为我最近发了一篇较为火爆的涨粉儿微信公众号文章《工具武装的前端开发工程师》,于是建了这么一个仓库,持续更新作为补充,搜集更多好用的软件工具。请Star、Pull Request或者使劲搓它 issu_awesomemac

java前端技术---jquery基础详解_简介java中jquery技术-程序员宅基地

文章浏览阅读616次。一.jquery简介 jQuery是一个快速的,简洁的javaScript库,使用户能更方便地处理HTML documents、events、实现动画效果,并且方便地为网站提供AJAX交互 jQuery 的功能概括1、html 的元素选取2、html的元素操作3、html dom遍历和修改4、js特效和动画效果5、css操作6、html事件操作7、ajax_简介java中jquery技术

Ant Design Table换滚动条的样式_ant design ::-webkit-scrollbar-corner-程序员宅基地

文章浏览阅读1.6w次,点赞5次,收藏19次。我修改的是表格的固定列滚动而产生的滚动条引用Table的组件的css文件中加入下面的样式:.ant-table-body{ &amp;amp;::-webkit-scrollbar { height: 5px; } &amp;amp;::-webkit-scrollbar-thumb { border-radius: 5px; -webkit-box..._ant design ::-webkit-scrollbar-corner

javaWeb毕设分享 健身俱乐部会员管理系统【源码+论文】-程序员宅基地

文章浏览阅读269次。基于JSP的健身俱乐部会员管理系统项目分享:见文末!

论文开题报告怎么写?_开题报告研究难点-程序员宅基地

文章浏览阅读1.8k次,点赞2次,收藏15次。同学们,是不是又到了一年一度写开题报告的时候呀?是不是还在为不知道论文的开题报告怎么写而苦恼?Take it easy!我带着倾尽我所有开题报告写作经验总结出来的最强保姆级开题报告解说来啦,一定让你脱胎换骨,顺利拿下开题报告这个高塔,你确定还不赶快点赞收藏学起来吗?_开题报告研究难点

原生JS 与 VUE获取父级、子级、兄弟节点的方法 及一些DOM对象的获取_获取子节点的路径 vue-程序员宅基地

文章浏览阅读6k次,点赞4次,收藏17次。原生先获取对象var a = document.getElementById("dom");vue先添加ref <div class="" ref="divBox">获取对象let a = this.$refs.divBox获取父、子、兄弟节点方法var b = a.childNodes; 获取a的全部子节点 var c = a.parentNode; 获取a的父节点var d = a.nextSbiling; 获取a的下一个兄弟节点 var e = a.previ_获取子节点的路径 vue