1. 汇编语言与存储器
漫长的秃头之旅开始了
机器语言
在学习汇编语言之前,我们首先来了解一下机器语言。机器语言是机器指令的集合。所谓的机器指令就是说是一台机器可以正确执行的命令,它是一列二进制数字。计算机将之转变为一列高低电平,以使计算机的电子器件受到驱动,进行运算。
- 最早之前所谓的计算机是指可以专门执行机器指令,进行运算的机器,我们所说的PC机,有一个芯片来完成是上面所说的计算机的功能,这个芯片就是我们常说的CPU(Central Processing Unit,中央处理单元),CPU是一种微处理器。
- 每一种微处理器,由于硬件设计和内部结构的不同,就需要用不同的电平脉冲来控制,使它工作。所以每一种微处理器的都有自己的机器指令集,也就是机器语言。
- 在早期的程序设计均使用机器语言。程序们将用0、1数字编成的代码打在纸袋或卡片上。1打孔,0不打孔,再将程序通过纸袋机或卡片机输入计算机进行运算。
- 机器语言编写的程序多而复杂,仅仅输出一句的简单的话可能就需要近百行的0和1,如果程序里有一个’1’被误写成’0’,又如何去查找呢?
- 早期的程序员们很快就发现了使用机器语言带来的麻烦,它是如此难于辨别和记忆,给整个产业的发展带来了障碍。于是汇编语言产生了。
汇编语言
汇编语言概述
汇编语言的主体是汇编指令,汇编指令其实和机器指令在作用上其实是相同的,差别在于指令的表示方法上:汇编指令是机器指令便于记忆的书写格式。例如:机器指令1000100111011000表示把寄存器BX的内容送到AX中。汇编指令则写成mov ax,bx。这样的写法与人类语言接近,便于阅读和记忆。
寄存器:简单地讲是CPU中可以存储数据的器件,一个CPU中有多个寄存器。AX是其中一个寄存器的代号,BX是另一个寄存器的的代号。
但是计算机能够读懂的只有机器指令,那么如何让计算机执行程序员用汇编指令编写的程序呢?编译器:能够将汇编指令转换成机器指令的翻译程序。
汇编语言的组成:[汇编语言的核心是汇编指令,它决定了汇编语言的特性]
- 汇编指令:每一条指令在源程序汇编时都要产生可供计算机执行的指令代码,其实就是说每一个汇编指令都有对应的机器码。
- 伪指令:顾名思义,它不是真正的指令,用于告诉汇编程序如何汇编源程序,所以这种语句又叫命令语句。
- 例如告诉汇编程序,该源程序人如何分段,有哪些逻辑段在程序段中,哪些是当前段等等。为了实现更高级的功能,才出现的伪指令。
- 伪指令不直接控制运行时刻的机器,但是控制翻译程序如何生成机器指令代码,也就是只为编译服务,编译完成后,伪指令的作用也就消失了。
- 其它符号:如+、-、*、/等,由编译器识别,没有对应的机器码
什么是寄存器?
CPU的动力指令和数据就存放在存储器中,也就是我们平时所说的内存。CPU类似于大脑,而内存则是记忆,没有记忆也就无法进行思考。磁盘虽然也是存储设备,但是不同于内存,磁盘上的数据或程序如果不读到内存中,就无法被CPU使用。
- 指令和数据:在内存或磁盘上,指令和数据没有任何区别,都是二进制信息。CPU在工作的时候,把有的信息看作为指令,有的信息看作为数据,同样的二进制信息赋予了不同的意义。
- 棋盘里的黑白子,在棋盒中没有任何的区别,但是在对弈中就有了不同的意义
- 例如:1000100111011000,计算机可以把它看作大小为89D8H的数据来处理,也可以将其看作指令mov ax,bx来执行。
- 存储单元:存储器被划分成若干个存储单元,每个存储单元从0开始顺序编号。
- 电子计算机中最小信息单位是二进制位(bit),8个bit组成一个字节(Byte,存储器最小计算单位)。一个微机存储器有128个存储单元,它可以存储128个Byte。
CPU对存储器的读写
首先我们之前有讲到,存储器被划分成多个存储单元,存储单元从零开始顺序编号。这些编号可以看着做存储单元在存储器中的地址,类似于门牌号码。如果CPU要从内存中读数据,首先要指定存储单元的地址。也就是说它要先确定它要读取哪一个存储单元中的数据。就像找人,你要知道他住在哪。另外CPU在读写数据时还要指明,它要对哪一个器件进行操作,进行哪种操作,是从中读出数据,还是向里面写入数据。
- 可见与器件进行下面3类交互:
- 存储单元的地址(地址信息:告诉你应该从内存的哪块地方拿数据)
- 器件的选择,读或写的命令(控制信息:你所要做的操作)
- 读或写的数据(数据信息)
总线
CPU通过导线传输电信号,将地址、数据和控制信息传到存储芯片中。
总线从逻辑上分为:地址总线、控制总线和数据总线
- CPU通过地址线将地址信息3发出。
- CPU通过控制线发出内存读指令,选中存储信息,并通知它,将要从中读取数据。
- 存储器将3号单元中的数据8通过数据线送入CPU
CPU从3号单元中写入数据的过程:
- CPU通过地址线将地址信息3发出。
- CPU通过控制线发出内存写命令,选中存储芯片,并通知他,要向其中写入数据。
- CPU通过数据线将数据26送入内存的3号单元中。
过程图如下:
地址总线
CPU通过地址总线来指定存储器单元,可见地址总线上能够传送多少个不同信息,CPU就可以对多少个存储单元进行寻址。
- 现在假设有10根地址总线,那么让我们来看一下它的寻址情况:10根导线可以传送10位二进制数据,那么可以查找2^10方也就是1024个存储单元,1024个字节,那么1025个字节就无法查找到。
再拿X86的系统做例子:32位的系统,32根地址总线,可寻找2^32个存储单元。
4,294,967,296B = 4,194,304 KB = 4096MB = 4GB
,所以32位的系统最多支持4G内存。CPU向内存发出地址信息11时,10根到线上传送的二进制信息:
一个CPU有N根地址线,则可以说这个CPU的地址总线的宽度为N。这样的CPU最多可以寻找2的N次方各个内存单元。
数据总线
数据总线的宽度决定了CPU和外界数据的传输速度
- 8根数据总线一次可以传送一个8位二进制数据,16根数据则是2个字节
- 例如8086CPU有16根数据线,可以一次传送16位数据,所以可以一次传输数据89D8H;而8088只有8根数据线,一次只能传8位数据,所以向内存写入数据89D8H时需要进行两次数据传送。
控制总线
CPU对外部器件的控制是通过控制总线来进行的。控制总线是一些不同控制线的集合。有多少根控制总线,就意味着CPU提供了对外部器件的多少种控制。
- 控制总线的宽度决定了CPU对外部器件的控制能力,我们前面所讲的CPU向外传出读写信号,就是分别由两根控制总线来完成。