汇编是从机器语言演变过来的,想要认识汇编就要了解机器语言。那机器语言是什么呢?机器语言就是0和1。
1.机器语言
什么是机器语言?就是由0和1组成的机器指令
加:0100 0000
减:0100 1000
乘:1111 0111 1110 0000
除:1111 0111 1111 0000
机器指令简而言之就是一台机器可以正确执行命令的一串二进制的数字(0和1)。
但是呢,使用机器指令写程序实在是太复杂了,下面可以看一张图,是我从别处扣来的
这个介绍的是什么呢?就3个单词而已,就是这个“welcome to masm”。
是不是感觉整个人都不好了,一句好而已,都这么复杂,如果是复杂的程序还不崩溃。
而且如果写错了一个0或1,找错都找死你,所以呢,汇编因此诞生了。
2.汇编语言(assembly language)
汇编语言是由一系列的汇编指令组成的
和机器指令的差别就是在于表达方式上不一样
汇编指令是机器指令便于记忆的书写格式,也就是使用助记符代替机器语言
如:
加:INC EAX 通过编译器 0100 0000
减:DEC EAX 通过编译器 0100 1000
乘:MUL EAX 通过编译器 1111 0111 1110 0000
除:DIV EAX 通过编译器 1111 0111 1111 0000
3.高级语言
C\C++\Java\OC|\swift,这些语言更加接近人类自然语言,所以它们是高级语言
如:
加:A+B 通过编译器 0100 000
减:A-B 通过编译器 0100 1000
乘:A*B 通过编译器 1111 0111 1110 0000
除:A/B 通过编译器 1111 0111 1111 0000
平时我们使用编译器编写的高级语言在终端设备上的运行过程是这样的:
从上面例子和图可以了解到汇编语言和机器语言是一一对应的
汇编语言可以通过编译得到汇编机器语言;反之,机器语言也可以通过反编译得到汇编语言。
高级语言也可以通过编译得到汇编语言,
but,汇编语言、机器语言基本上不可能还原成高级语言(某些特定情况还是可以的,基本靠蒙)。为什么呢,因为不同的机器上生成的汇编指令是不同的,不同的高级语言生成的汇编指令也可能是一样的。
4.汇编语言的特点
<1> 可以直接访问、控制各种硬件设备,比如存储器、CPU等,能最大限度发挥硬件的功能。
<2> 可以不受编译器的限制,对生成的二进制代码进行完全的控制
<3> 目标代码简短,占用内存少,执行速度快
<4> 汇编指令是机器指令的助记符,同机器指令一一对应,每一种CPU都有自己的机器指令集(汇编指令集),所以汇编语言不具备可移植行
<5> 知识点多、复杂,所以开发者需要对CPU等硬件结构有所了解,不易于缩写、调试、维护
<6> 不区分大小写 ,MOV和mov是相同的。
5.汇编语言的用途
<1> 编写驱动程序、操作系统(如Linux内核的某些关键部分)
<2> 对性能要求极高的程序或代码片段,可以内联汇编(与高级语言混合使用)
<3> 软件安全
(1)病毒分析与治防
(2)逆向、加壳、脱壳、破解、外挂、免杀、加密解密、漏洞、黑客等等
<4> 理解整个计算机系统的最佳起点和最有效途径
<5> 为编写高效代码打下基础
<6> 了解代码本质,如:函数的本质?编译器帮我们干了什么?debug模式和release模式有哪些关键点被忽略?
<7> 最后一点,学会了汇编最重要的用途,大家一定要牢记:装逼(无形装逼,最为致命)
6.汇编语言的种类
目前讨论比较多的汇编语言有
<1> 8086汇编(8086处理器是16bit的CPU)
<2> Win32汇编
<3> Win64汇编
<4> ARM汇编(嵌入式,MAC,iOS)
iPhone手机用的就是ARM汇编,但是不同的设备也有差异,因为CPU的架构不同
7.如何学好汇编语言
想要学好汇编,第一点要做的就是了解CPU等硬件结构和程序的执行过程
硬件相关最为重要的是CPU/内存
在汇编中,大部分指令都是和CPU与内存相关的
8.汇编就先介绍到这,下一篇开始介绍CPU