arm基础知识

96
一川烟草i蓑衣
2018.07.24 15:03* 字数 1856

寄存器种类:

通用寄存器:

64位: X0-X30 

32位: W0-W30  是低地址

特殊寄存器:

零寄存器:XZR/WZR,写该寄存器会被忽略,读该寄存器会得到全0值。

PC:程序指针寄存器,64位。注意,还是叫PC,不叫XPC啊!在ARMv7之前,PC可以做为R15,当成通用寄存器来使用,在ARMv8上,不允许直接访问;它指示了CPU当前要读取指令的地址。cpu将pc指向的内存单元视为指令,依此区分数据和指令

注:bl指令使用:mov指令(传送指令),可以用来修改大部分寄存器的值,但是,mov指令不能用于设置pc的值;ARM64提供了另外的指令来修改PC的值,这些指令统称为转移指令,最简单的是bl指令。

SP:栈寄存器,保存栈底地址,64位。对应的32位为WSP,但是64位的这个就叫SP不叫XSP啊!SP是每个EL对应一个(反正咱们只有EL0这个)。

fp:x29通用寄存器,但是某些时刻用来保存栈顶地址

ELR(Exception Link Register):异常链接寄存器,EL1~EL3各有一个。存储了从中断返回的地址,这个咱们应用没权限用,本系列中学不到

SPSR:(Saved Processor State):EL1~EL3各有一个。保存了发生异常时的状态信息,这个咱们也用不着

浮点向量寄存器:

浮点寄存器 64位: D0 - D31 32位: S0 - S31

现在的CPU支持向量运算.(向量运算在图形处理相关的领域用得非常的多)为了支持向量计算系统了也提供了众多的向量寄存器.

向量寄存器 128位:V0-V31

SP和FP寄存器

sp寄存器在任意时刻会保存我们栈顶的地址.

fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!()

注意:ARM64开始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp  str\stp

ARM64里面 对栈的操作是16字节对齐的!!

lr寄存器

用于保存函数的返回地址,常用来配合bl和ret指令来实现函数跳转和返回

cpu读取内存操作指令

ldr(load register)指令:从内存中读出32位数据到寄存器中

ldp指令:从内存中读出64位数据到寄存器中,可以操作两个寄存器

cpu写入内存操作指令

stur(store register)指令:把寄存器32位的值存到内存中

stp/str指令:把寄存器128/64位存到内存中,stp可以操作两个寄存器

堆栈操作练习1:

mov x0,#0xa0mov x1,#0xb0;然后将x0,x1入栈

arm代码:

mov x0,#0xa0

mov x1,#0xb0

sub    sp, sp,#0x10 (16进制加10等于十进制加16,即开辟16个字节来存放x0和x1)

stp    x0, x1, [sp] (此时sp=0x16baab990)

add sp,sp,#0x10   //栈平衡将栈回收

执行结果

堆栈操作练习2:

使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换.

mov x0,#0xa0

mov x1,#0xb0

sub    sp, sp,#0x20    ;//拉伸栈空间32个字节(注意一个寄存器是64位即8个字节)注:此时sp=0x16b927980 (拉伸栈空间为什么用sub?因为栈是从高地址到低地址的,而堆是从低地址到高地址的,两者正好不冲突)

/*

补充:sp拉伸空间的大小是根据什么?

函数的参数和局部变量的内存空间大小 + x29、x30的内存空间大小

拉伸空间的大小最少为16字节,并且必须是16字节的倍数

*/

stp    x0, x1, [sp] ;//sp往上加16个字节,在栈中存放x0 和 x1(16字节=16*8=128位,注意此时sp不变,此时x0=a0,x1=b0)

执行上面的语句后内存变为:(注:debug->debug workflow->view memory查看内存)

Memory

图中每两个数字代表一个字节,0x16b927980往后数16个字节,后16个字节是x0和x1的值

注:每个数字都是十六进制,右侧小窗口是ascII码翻译后的符号或字母

ldp    x1, x0, [sp,#0x10] ;//将sp偏移16个字节的值取出来,放入x1 和 x0,注意此时sp不变

add sp,sp,#0x20   //栈平衡将栈回收

栈详解:

栈示意图

栈是从高地址往底地址走的,如果一直走到头会发生堆栈溢出

注意图中每一格递增8个地址代表8个字节(每个字节都有一个地址)

栈平衡:

每次调用函数之前要拉伸栈,调用之后要回收栈

比如:开始sub sp,sp #0x20

结束add sp,sp #0x20

栈中存放着临时变量和实参

举例:

int sum(int a,int b){

    return a+b;

}

int main(int argc,char *argv[]){

    while(true){

        sum(10,20);

    }

}

问:这种情况下程序会崩溃吗?

答:不会,因为每次都是完整的函数调用,每次调用完毕之后都会栈平衡

bl和ret指令:

两者配合使用来实现函数跳转和返回,x30寄存器存放的是函数的返回地址,当ret指令执行时刻,会寻找x30寄存器的地址值。

bl:

1)将下一条指令的地址(注意下一条指的是跳转回来之后的指令)放入lr(x30)寄存器,保存回家的地址

2)跳转到标号处

ret:

1)返回到 lr 寄存器所保存的地址

2)pc 寄存器指向此地址,并执行下一步指令

函数的返回值和参数:

arm64下,函数的参数是存放在X0到X7(W0到W7)这8个寄存器里面,如果超过8个参数,就会入栈

函数的返回值是放在X0寄存器里面的

adrp指令:

可以根据adrp指令算出来的地址,可以去得到变量存储的相应的地址

adrp x0, 1

其实做了下面的步骤

1. 将1的值,左移12位 1 0000 0000 0000 == 0x1000

2.将PC寄存器的低12位清零0x104bee870 ==> 0x104bee000,这里的PC寄存器的值是到adrp x0 1的那里的PC寄存器里面的值

3.将1 和 2 的结果相加给X0 寄存器!!0x104bef000

为什么会存在adrp指令呢?需要理解一个进程的内存空间是分区域的:

代码区:可读可执行

堆区: 动态申请,可读可些

栈区:放参数、局部变量、保护现场等

全局变量区:可读可写

常量区:只读

代码区域访问常量区域或全局变量区域可以使用adrp指令,获取变量区域所在的页地址。

ARM汇编