編輯:關於Android編程
一種使用OpenGL渲染文字的常用方法,是計算出一個包含了顯示文字的紋理圖片,這通常是使用相當復雜的打包算法來最小化紋理中的冗余部分,在創建這樣的圖片之前必須清楚應用運行時使用的字體,包括了字體形狀,尺寸和其他的一些屬性。
在Android上,提前生成文字紋理圖片是不太實際的,因為沒有方法提前知道應用使用了哪些字體和字形,應用甚至可以在運行時加載自定義字體,這是許多限制因素中的主要一個,Android字體渲染必須實現下面的工作:
必須可以在運行時創建字體緩存 必須能夠處理大量的字體 必須能夠處理大量的字形 最小化紋理的浪費 速度必須快 在低端和高端設備上都運行的很快 在任何的驅動/GPU組合上正常運行在我們查看低級別的OpenGL字體渲染是如何工作之前,我們先從應用直接使用的高級別API開始,這些API對於理解libhwui的工作是非常重要的。
Text APIs
應用主要使用下面的四個API來布局和繪制文字:
TextView和android.text是在Paint和Canvas上面的高級別實現。直到Android 3.0,Paint和Canvas是直接在Skia上面實現的,Skia是一個軟件渲染庫,它提供了一個非常好的Freetype(非常流行的文字光柵化開源代碼)抽象。
vcHLNC40uf2zzLHktcO4/LzTuLTU08HLo6xQYWludLrNQ2FudmFzyrnTw8Tasr+1xEpOSb3Tv9pUZXh0TGF5b3V0Q2FjaGXAtLSmwO24tNTTzsTX1rXEbGF5b3V0o6zV4rj2QVBJ0sDAtdPaSGFyZmJ1enqjqNK7uPa/qtS0tcTOxNfWs8nQzdL9x+ajqaOsVGV4dExheW91dENhY2hltcTK5MjrysfSu7j2Zm9udLrN0ru49kphdmEgVVRGLTE2tcRzdHJpbmejrMrks/bKx7D8uqx4o6x5zrvWw7XE19bQzrHqyra3+8HQse2hozwvcD4NCjxwPlRleHRMYXlvdXRDYWNoZcrH1f3It9ans9bQ7bbgt8fArbah0+/R1LXEudi8/KOsscjI57CiwK2yrtPvoaLPo7KuwLTT76GizKnT77XIoaO75tbGzsTX1rHIvPK1pbXEtNPX87W909LSu7j2vdPSu7j2tcS3xdbDzsTX1ri01NO1xLbgo6zSu9Cp0+/R1LHIyOewosCtsq7T76Osyse009PStb3X87XEo6zMqdPvyfXWwdDo0qrOxNfWsbu3xdbDtb3HsNK7uPbOxNfWtcTJz8Pmu/LV38/Cw+ahozwvcD4NCjxwPjxpbWcgYWNjZWxlcmF0ZWQ9"" alt="Android" hardware="" rendering="" src="/uploadfile/Collfiles/20150520/2015052008370816.png" text="" title="\" />
這意味這當你調用Canvas.drawText()方法時,openGL渲染引擎不會直接或者間接的接收到你發送的參數,但是會收到字形標識符數組和x/y位置數組
字體渲染的每一次draw調用都是和一個單獨的font關聯的,font是用來緩存各個字形,字形反過來被存儲在一個緩存結構中(cache texture),這個緩存結構可以用來包含多種字體的字形。cache texture是一個非常重要的對象,它有多種緩存:空閒塊列表,像素緩存,OpenGL紋理句柄,頂點緩存(the mesh,網格,構成圖形的基本單位)。
用來存儲這些對象的數據結構是相當簡單的:
Fonts被存儲在font渲染器的LRU緩存中 字形(Glyphs)被存儲在每一個font的map中,key是字形標識符 Cache textures(緩存結構)跟蹤鏈表塊的空閒位置 像素緩存是uint8_t或者uint_32t的數組(alpha和RGBA的緩存) mesh是有兩個屬性的頂點緩存:x/y位置和u/v坐標 texture是一個GLuint類型的句柄當字體渲染器初始化的時候,它創建了兩種類型的cache textures:alpha和RGBA。Alpha textures用來存儲正常的字形,因為字體不包含顏色信息,我們只需要存儲抗鋸齒信息。RGBA緩存被用來存儲表情符號。
對每一種類型的cache texture,字體渲染器創建一些不同尺寸大小的CacheTexture實例,根據設備的不同緩存的大小也不同,下面是一些默認的尺寸:
當一個CacheTexture被創建的時候,底層的緩存並沒有被自動分配,字體渲染器在需要的時候才會進行分配,除了1024x512alpha緩存,它總是被分配的。
字形在textures以列的形式進行打包,當渲染器遇到一個沒有緩存的字形,它會按照上面列出來的順序尋找合適的CacheTexture緩存字形。
這就是塊列表使用的地方,它包含了cache texture的當前分配列和可用的空閒位置。如果字形符合存在的列,它會被添加到該列所占空間的末尾。
如果所有的列都被占用了,一個新的列會在剩余空間的左側劃分出來。因為很少的字體是等寬的,渲染器分配每一個字形的寬度為4像素的倍數。這是對列的重用和texture打包的好的折衷方案。打包不是最佳的,但是它提供了快速實現。
所有的字形周圍都有一個像素的空邊界,它們都存儲在textures中,對於采取雙重線性采樣的font textures來說,這麼做可以避免人工處理。
知道text在渲染的時候是否進行尺寸變換是非常重要的,變換被提交給Skia/Freetype,這意味著cache textures裡的字形存儲了變換,這在性能消耗方面提高了渲染質量。幸運的是,text是很少動態縮放的,即使有,也只有很少的字形被影響到。還有其他的paint屬性可以影響字形的光柵化和存儲:仿粗體,文字偏斜,X縮放,風格和線寬。
由於libhwui是延遲渲染的,和Skia的直接模式相反,在一幀開始的時候,已經知道需要被繪制到屏幕上的字形了,在顯示列表操作排序的時候,字體渲染器會盡可能多的預緩存字形。這樣做的好處是會完全避免或者最小化在幀中間上傳texture的數量。texture上傳是非常耗資源的操作,會導致CPU或者GPU暫停,更糟糕的是,在幀中間修改texture會對一些GPU產生嚴重的內存壓力。
ImaginationTech的PowerVR SGX GPU在幀中間修改的時候,會強制驅動復制每一個修改的texture,因為一些font的texture是非常大的,如果不小心texture上傳的話,會更加容易導致oom。Google paly上面有一個計算器應用出現過這種情況,它用數學符號和數字繪制按鈕,在字體渲染的時候,可能會出現oom,因為按鈕的繪制是一個接一個的, 每一次繪制都會觸發texture上傳,這導致了整個font緩存的復制,系統沒有那麼多的內存來放置這麼多份緩存的拷貝。
用來緩存字形的textures是相當大的,所以當其他應用需要更多內存的時候它們可能會被系統回收。當用戶隱藏當前應用的時候,系統會發消息通知應用釋放盡可能多的內存,應用在大部分情況下會摧毀最大的textures緩存。在Andorid設備上,除了第一個被創建的(默認為1024x512)其他所有的textures緩存都被認為是大的textures。
當沒有所有的緩存中都沒有空間的時候,textures會被刷新,font渲染器會保持一個LRU(最近最少使用)的列表,但是沒有使用它做任何事情,如果需要的話,通過刷新很少使用的內存來是緩存的刷新更加智能,目前位置還沒有需要這樣做,但是要記住它是潛在的優化方向。
Android 4.3介紹了繪制操作的批處理與合並,一個非常重要的優化是大幅減少了傳遞給OpenGL驅動的命令數。
為了實現合並,font渲染器緩存了多個繪制命令的文本幾何數據。每一個緩存texture有一個客戶端數組,裡面包含了2048個四邊形(1四邊形 = 1 字形),他們都共享一個獨立的索引緩沖(在GPU中以VBO存在)。
當libhwui執行一個文字繪制命令時,文字渲染器會為每一個字形獲取合適的mesh(網格,構成圖形的基本單位)並會將位置和u/v坐標寫進去。Mesh會在一批結束或者quad緩存滿了之後傳送到GPU。渲染一個單獨的string可能需要多個mesh,每個緩存texture有一個mesh。
這個優化是比較容易實現,並且會極大的提高性能。由於文字渲染器使用多個緩存texture,有可能會出現string中的大部分字形是一個texture的一部分,而一些字形是另一個texture的一部分。如果沒有批處理和合並操作,在每一次文字渲染器需要切換到不同的緩存texture時,都會給GPU提交一個繪制命令。
我曾經在一個test的app中碰到過這種問題,這個應用只是渲染不同風格和尺寸的“hello world”,在“o”字母和其他的字形被存在不同的texture中的特定情況下。這會導致文字渲染器會先渲染“hell”,然後“o”,然後“w”,然後“o”,然後“rld”,總共執行了5個繪制命令和5個texture綁定,而實際上兩個都之需要2次,現在的渲染器先繪制“hell w rld”然後一塊繪制兩個“o”。
前面曾經提過文字渲染器會在更新緩存texture時嘗試盡可能少的上傳數據,通過跟蹤每一個texture的被變動的部分(dirty rect),可惜的時這種方法有兩個限制。
首先,OpenGL ES2.0不允許上傳一個隨意的子矩形。glTexSubImage2D允許你指定矩形的x/y和width/height來更新texture的一部分,但是它是假設存在於主內存數據的stride(步幅)是矩形的寬度。這個可以通過創建合適尺寸的CPU緩存來實現,但前提是必須知道變動矩形的大小。一個比較好的折中方法是上傳一個最小的包含dirty rect的像素帶,因為這個像素帶的寬度是和texture一樣的,所以我們可能會浪費一些帶寬,但還是比上傳整個texture好。
第二個問題是,texture上傳是同步的操作,這可能會導致cpu長時間的等待,對於已經預先緩存的其實影響不大。但是對於使用了很多文字的應用或者有很多字形的語言環境,比如中文,這個問題可能會被用戶感覺到。
幸運的是,OpenGL ES3.0對這兩個問題提供了解決方法,現在可以使用新的像素存儲屬性GL_UNPACK_ROW_LENGTH上傳字矩形了。這個屬性指定了stride或者內存中的源數據,但是要小心的是:這個屬性影響當前OpenGL context的全局狀態。
在texture上傳期間的CPU等待可以通過使用像素緩存對象(PBO)來避免,就想OpengGL中所有的buffer對象,PBO存在與GPU,但可以被映射進內存。PBO有很多有趣的屬性但是我們關心的是在從內存中取消映射後,它可以異步上傳texture,這樣操作的順序就變成了:
glMapBufferRange → write glyphs to buffer → glUnmapBuffer → glPixelStorei(GL_UNPACK_ROW_LENGTH) → glTexSubImage2D
現在調用glTexSubImage2D會直接返回,而不是阻塞渲染器。文字渲染器現在將整個buffer映射進內存,盡管它看起來沒有引起性能問題,但是將需要更新的cache texture的范圍映射進來而不是全部會更好。
文字通常是和陰影一起渲染的,一個相當耗費資源的操作。由於相鄰的字形會模糊進彼此,文字渲染器不能獨立的預先模糊字形。有許多方法來實現模糊,但是要在一幀中最小化混合操作和紋理采樣,陰影被以textures存儲並且會在多個幀中存在。
本文實例講述了Android編程實現自定義系統菜單背景的方法。分享給大家供大家參考,具體如下:不多說,上圖,見代碼。package lab.sodino.menutest
這幾天做項目,有些地方的圖片需要用到圓形圖片,所以百度了一下,在github上找到一個開源項目,處理很簡單,效果如下: 使用起來特別簡單,一共三步,具體如下:&
Android平台版本和設備碎片化很嚴重,因此從Win32平台移植到Android平台會有很多問題,下面是我們歸納的從Win32平台移植到Android平台遇到的一些問題
為什麼關注性能對於一款APP,用戶首先關注的是 app的性能,而不是APP本身的屬性功能,用戶不關心你是否是搞社交,是否搞電商,是否是一款強大的美圖濾鏡app,用戶首先關