中文字幕第五页-中文字幕第页-中文字幕韩国-中文字幕最新-国产尤物二区三区在线观看-国产尤物福利视频一区二区

深入理解AndroidNDK日志符號化

     為了進行代碼及產品保護,幾乎所有的非開源App都會進行代碼混淆,這樣當收集到崩潰信息后,就需 要進行符號化來還原代碼信息,以便開發者可以定位Bug。基于使用SDK和NDK的不同,Android的崩潰分為兩類:Java崩潰和C/C++崩潰。Java崩潰通過mapping.txt文件進行符號化,比較簡單直觀,而C/C++崩潰的符號化則需要使用Google自帶的一些NDK工具,比如ndk-stack、addr2line、objdump等。本文不去討論如何使用這些工具,有興趣的朋友可以參考同事寫的另一篇文章《如何定位Android NDK開發中遇到的錯誤》,里面做了詳細的描述。

公司主營業務:網站設計制作、網站制作、移動網站開發等業務。幫助企業客戶真正實現互聯網宣傳,提高企業的競爭能力。創新互聯是一支青春激揚、勤奮敬業、活力青春激揚、勤奮敬業、活力澎湃、和諧高效的團隊。公司秉承以“開放、自由、嚴謹、自律”為核心的企業文化,感謝他們對我們的高要求,感謝他們從不同領域給我們帶來的挑戰,讓我們激情的團隊有機會用頭腦與智慧不斷的給客戶帶來驚喜。創新互聯推出皮山免費做網站回饋大家。

基于NDK的Android的開發都會生成一個動態鏈接庫(so),它是基于C/C++編譯生成的。動態鏈接庫在Linux系統下廣泛使用,而Android系統底層是基于Linux的,所以NDK so庫的編譯生成遵循相同的規則,只不過Google NDK把相關的交叉編譯工具都封裝了。

       Ndk-build編譯時會生成的兩個同名的so庫,位于不同的目錄/projectpath/libs/armeabi/xxx.so和/project path/obj/local/armeabi/xxx.so,比較兩個so文件會發現體積相差很大。前者會跟隨App一起發布,所以盡可能的小,而后者包含了很多調試信息,主要為了gdb調試的時候使用,當然NDK的日志符號化信息也包含其中。

深入理解Android NDK日志符號化

    

    本文主要分析這個包含調試信息的so動態庫,深入分析它的組成結構。在開始之前,先來說說這樣做的目的或者好處。現在的App基本都會采集上報崩潰時的日志信息,無論是采用第三方云平臺(如Testin崩潰分析+),還是自己搭建云服務,都要將含調試信息的so動態庫上傳,實現云端日志符號化以及云端可視化管理。移動App的快速迭代,使得我們必須存儲管理每一個版本的debugso庫,而其包含了很多與符號化無關的信息。如果我們只提取出符號化需要的信息,那么符號化文件的體積將會呈現數量級的減少。同時可以在自定義的符號化文件中添加App的版本號等信息,實現符號化提取、上傳到云端、云端解析及可視化等自動化部署。另外,從技術角度講,你將不在害怕看到“unresolvedsymbol” linking errors,更從容地 debugging C/C++ crash或者hacking一些so文件。

 首先通過readelf來看看兩個不同目錄下的so庫有什么不同

 深入理解Android NDK日志符號化

   

    從中可以清楚看到,包含調試信息的so庫多了8個.debug_開頭的條目以及.symtab和.strtab條目。符號化的本質,是通過堆棧中的地址信息,還原代碼本來的語句以及相應的行號,所以這里只需解析.debug_line和.symtab,最終獲取到如下的信息就可以實現符號化了。

c85    c8b     willCrash       jni/hello-jni.c:27-29
c8b    c8d     willCrash       jni/hello-jni.c:32
c8d    c8f     JNI_OnLoad      jni/hello-jni.c:34
c8f    c93     JNI_OnLoad      jni/hello-jni.c:35
c93    c9d     JNI_OnLoad      jni/hello-jni.c:37

    通常,目標文件分為三類:relocatable文件、executable文件和shared object文件,它們格式稱為ELF(Executableand Linking Format),so動態庫屬于第三類shared object,它的整體組織結構如下:

ELF Header
Program header table
optional
Section 1
...
Section n
...
Section header table
required

ELF Header

ELF Header文件頭的結構如下,記錄了文件其他內容在文件中的偏移以及大小信息。這里以32bit為例。

typedef struct {
    unsigned char   e_ident[EI_NIDENT];
    Elf32_Half      e_type;          //目標文件類型,如relocatable、executable和shared object
    Elf32_Half      e_machine;   // 指定需要的特定架構,如Intel 80386,Motorola 68000
    Elf32_Word      e_version;   // 目標文件版本,通e_ident中的EI_VERSION
    Elf32_Addr      e_entry;       //指定入口點地址,如C可執行文件的入口是_start(),而不是main()
    Elf32_Off       e_phoff;   // program header table 的偏移量
    Elf32_Off       e_shoff;   // section header table的偏移量
    Elf32_Word      e_flags;  // 處理器相關的標志
    Elf32_Half      e_ehsize;  // 代表ELF Header部分的大小
    Elf32_Half      e_phentsize; // program header table中每一項的大小
    Elf32_Half      e_phnum;   // program header table包含多少項
    Elf32_Half      e_shentsize;  // section header table中每一項的大小
    Elf32_Half      e_shnum;  // section header table包含多少項
    Elf32_Half      e_shstrndx;  //section header table中某一子項的index,該子項包含了所有section的字符串名稱
} Elf32_Ehdr;

其中e_ident為固定16個字節大小的數組,稱為ELF Identification,包含了處理器類型、文件編碼格式、機器類型等,具體結構如下:

NameValuePurpose
EI_MAG00

前四個字節稱為magic number,分別為0x7f、’E’、’L’、’F’,表明文件類型為ELF。


EI_MAG1

1
EI_MAG22
EI_MAG33

EI_CLASS

4

表明文件是基于32-bit還是64-bit,不同的方式,對齊方式不同,讀取某些內容的大小不同。

EI_DATA5

表明文件數據結構的編碼方式,主要分為大端和小端兩種

EI_VERSION

6

指定了ELF文件頭的版本號

EI_OSABI

7

指定使用了哪種OS-或者ABI-的ELF擴展

EI_ABIVERSION8

指定該ELF目標文件的目標ABI版本

EI_PAD

9

保留字段起始處,直到第16個字節

EI_NIDENT16

代表了e_ident數組的大小,固定為16

Sections

該部分包含了除ELF Header、program header table以及section header table之外的所有信息。通過section header table可以找到每一個section的基本信息,如名稱、類型、偏移量等。

先來看看Section Header的內容,仍以32-bit為例:

typedef struct {
	Elf32_Word	sh_name; // 指定section的名稱,該值為String Table字符串表中的索引
	Elf32_Word	sh_type; // 指定section的分類
	Elf32_Word	sh_flags; // 該字段的bit代表不同的section屬性
	Elf32_Addr	sh_addr; // 如果section出現在內存鏡像中,該字段表示section第一個字節的地址
	Elf32_Off	sh_offset; // 指定section在文件中的偏移量
	Elf32_Word	sh_size; // 指定section占用的字節大小
	Elf32_Word	sh_link; // 相關聯的section header table的index
	Elf32_Word	sh_info; // 附加信息,意義依賴于section的類型
	Elf32_Word	sh_addralign; // 指定地址對其約束
	Elf32_Word	sh_entsize; // 如果section包含一個table,該值指定table中每一個子項的大小
} Elf32_Shdr;

通過Section Header的sh_name可以找到指定的section,比如.debug_line、.symbol、.strtab。

String Table


String Table包含一系列以\0結束的字符序列,最后一個字節設置為\0,表明所有字符序列的結束,比如:

深入理解Android NDK日志符號化

String Table也屬于section,只不過它的偏移量直接在ELF Header中的e_shstrndx字段指定。String Table的讀取方法是,從指定的index開始,直到遇到休止符。比如要section header中sh_name獲取section的名稱,比如sh_name = 7, 則從string table字節流的第7個index開始(注意這里從0開始),一直讀到第一個休止符(index=18),讀取到的名稱為.debug_line


Symbol Table


該部分包含了程序符號化的定義相關信息,比如函數定義、變量定義等,每一項的定義如下:

# Symbol Table Entry

typedef struct {
	Elf32_Word	st_name; //symbol字符串表的索引
	Elf32_Addr	st_value; //symbol相關的值,依賴于symbol的類型
	Elf32_Word	st_size; //symbol內容的大小
	unsigned char	st_info;   //symbol的類型及其屬性
	unsigned char	st_other;  //symbol的可見性,比如類的public等屬性
	Elf32_Half	st_shndx; //與此symbol相關的section header的索引
} Elf32_Sym;

Symbol的類型包含一下幾種

NameValue
STT_NOTYPE0
STT_OBJECT1

STT_FUNC

2

STT_SECTION

3

STT_FILE

4

STT_COMMO

5

STT_TLS

6

STT_LOOS

10
STT_HIOS12

STT_LOPRO

13

STT_HIPROC

15

其中STT_FUNC就是我們要找的函數symbol。然后通過st_name從symbol字符串表中獲取到相應的函數名(如JNI_OnLoad)。當symbol類型為STT_FUNC時,st_value代表該symbol的起始地址,而(st_value+st_size)代表該symbol的結束地址。

回顧之前的提到的.symtab和.strtab兩個部分,對應的便是Symbol Section和Symbol String Section。

DWARF(Debugging With Attributed Record Formats)

DWARF是一種調試文件格式,很多編譯器和調試器都通過它進行源碼調試(gdb等)。盡管它是一種獨立 的目標文件格式,但往往嵌入在ELF文件中。前面通過readelf看到的8個.debug_* Section全部都屬于DWARF格式。本文將只討論與符號化相關的.debug_line部分,更多的DWARF信息請查看參考文獻的內容。

.debug_line部分包含了行號信息,通過它可以將代碼語句和機器指令地址對應,從而進行源碼調試。.debug_line有很多子項組成,每個子項都包含類似數據塊頭的描述,稱為Statement Program Prologue。Prologue提供了解碼程序指令和跳轉到其他語句的信息,它包含如下字段,這些字段是以二進制格式順序存在的:

total_length

uword

整個子項占用的字節大小,注意并不包括該字段本身

versio

uhalf

該子項格式的版本號,其實也是整個DWARF格式的版本號,目前總共有四個版本。

prologue_length

uword

prologue的長度,不包括該字段及前面的兩個字段占用的字節數,即相對于本字段,程序語句本身的第一個字節的偏移量

minimum_instruction_length

ubyte

最小的目標機器指令

default_is_stmt

ubyte

is_stmt寄存器的初始值

line_base

sbyte

不同的操作碼,代表不同的含義,只影響special opcodes

line_range

ubyte

不同的操作碼,代表不同的含義,只影響special opcodes

opcode_base

ubyte

第一個操作碼的數值

standard_opcode_lengths

array of ubyte

標準操作碼的LEB128操作數的數值

include_directories

sequence

目錄名字符序列

file_names

sequence

源代碼所在文件名字符序列

這里用到的機器指令可以分為三類:

special opcodes

單字節操作碼,不含參數,大多數指令屬于此類

standard opcodes

單字節操作碼,可以包含0個或者多個LEB128參數

extended opcodes

多字節操作碼

這里不做機器指令的解析說明,感興趣的,可以查看參考文獻的內容。

通過.debug_line,我們最終可以獲得如下信息:文件路徑、文件名、行號以及起始地址。

最后我們匯總一下整個符號化提取的過程:

1、從ELF Header中獲知32bit或者64bit,以及大端還是小端,基于此讀取后面的內容

2、從ELF Header中獲得Section Header Table在文件中的位置

3、讀取Section Header Table,從中獲得.debug_line、.symtab以及.strtab三個section在文中的位置

4、讀取.symtab和.strtab兩個section,最后獲得所有function symbol的名稱、起始地址以及結束地址

5、讀取.debug_line,按照DWARF格式解析獲取文件名稱、路徑、行號以及起始地址

6、對比步驟4和5中獲取的結果,進行對比合并,形成最終的結果

參考文獻:

http://www.csdn.net/article/2014-12-30/2823366-Locate-Android-NDK

http://eli.thegreenplace.net/2011/02/07/how-debuggers-work-part-3-debugging-information/

http://www.sco.com/developers/gabi/latest/ch5.intro.html

http://www.dwarfstd.org/


當前標題:深入理解AndroidNDK日志符號化
網站鏈接:http://m.2m8n56k.cn/article14/jdcsge.html

成都網站建設公司_創新互聯,為您提供網站建設網站收錄定制開發App開發網站營銷營銷型網站建設

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

成都seo排名網站優化
主站蜘蛛池模板: 美国毛片视频 | xoxoxoxo欧美性护士 | 国产欧美一区二区三区视频在线观看 | 韩国三级 mp4 | 99久在线观看 | 日本三级成人午夜视频网 | 亚洲精品色综合色在线观看 | 日韩精品视频一区二区三区 | 亚洲欧美精品一区天堂久久 | 国产在线一区二区 | 免费观看视频成人国产 | 91精品欧美一区二区三区 | 欧美一欧美一级毛片 | 看三级网站 | 国产精品免费aⅴ片在线观看 | 人人公开免费超级碰碰碰视频 | 嫩小性性性xxxxbbbb | 青青影院一区二区免费视频 | 成人国产视频在线观看 | 2345成人高清毛片 | 成人不卡视频 | 一级毛片在播放免费 | 麻豆第一页 | 久久国产成人精品麻豆 | 日本亚洲成高清一区二区三区 | 一色屋色费精品视频在线观看 | www.久久精品| 免费视频网站一级人爱视频 | 精品久久久久久久久免费影院 | 在线毛片网站 | 国产美女无遮挡软件 | 男女男在线精品网站免费观看 | 免费特黄一级欧美大片 | 91久久青草精品38国产 | 高清不卡毛片免费观看 | 欧美精品videos | 国产精品欧美韩国日本久久 | 黄色毛片视频网站 | 精品国产一区二区三区在线 | 看一级特黄a大一片 | 中文久草|