1. 汇编语言与存储器

漫长的秃头之旅开始了

机器语言

在学习汇编语言之前，我们首先来了解一下机器语言。机器语言是机器指令的集合。所谓的机器指令就是说是一台机器可以正确执行的命令，它是一列二进制数字。计算机将之转变为一列高低电平，以使计算机的电子器件受到驱动，进行运算。

最早之前所谓的计算机是指可以专门执行机器指令，进行运算的机器，我们所说的PC机，有一个芯片来完成是上面所说的计算机的功能，这个芯片就是我们常说的CPU(Central Processing Unit，中央处理单元),CPU是一种微处理器。
- 每一种微处理器，由于硬件设计和内部结构的不同，就需要用不同的电平脉冲来控制，使它工作。所以每一种微处理器的都有自己的机器指令集，也就是机器语言。
在早期的程序设计均使用机器语言。程序们将用0、1数字编成的代码打在纸袋或卡片上。1打孔，0不打孔，再将程序通过纸袋机或卡片机输入计算机进行运算。
- 机器语言编写的程序多而复杂，仅仅输出一句的简单的话可能就需要近百行的0和1，如果程序里有一个’1’被误写成’0’，又如何去查找呢?
早期的程序员们很快就发现了使用机器语言带来的麻烦，它是如此难于辨别和记忆，给整个产业的发展带来了障碍。于是汇编语言产生了。

汇编语言

汇编语言概述

汇编语言的主体是汇编指令，汇编指令其实和机器指令在作用上其实是相同的，差别在于指令的表示方法上：汇编指令是机器指令便于记忆的书写格式。例如：机器指令1000100111011000表示把寄存器BX的内容送到AX中。汇编指令则写成mov ax,bx。这样的写法与人类语言接近，便于阅读和记忆。

寄存器：简单地讲是CPU中可以存储数据的器件，一个CPU中有多个寄存器。AX是其中一个寄存器的代号，BX是另一个寄存器的的代号。
但是计算机能够读懂的只有机器指令，那么如何让计算机执行程序员用汇编指令编写的程序呢？编译器：能够将汇编指令转换成机器指令的翻译程序。
汇编语言的组成：[汇编语言的核心是汇编指令，它决定了汇编语言的特性]
- 汇编指令：每一条指令在源程序汇编时都要产生可供计算机执行的指令代码，其实就是说每一个汇编指令都有对应的机器码。
- 伪指令：顾名思义，它不是真正的指令，用于告诉汇编程序如何汇编源程序，所以这种语句又叫命令语句。
  - 例如告诉汇编程序，该源程序人如何分段，有哪些逻辑段在程序段中，哪些是当前段等等。为了实现更高级的功能，才出现的伪指令。
  - 伪指令不直接控制运行时刻的机器，但是控制翻译程序如何生成机器指令代码，也就是只为编译服务，编译完成后，伪指令的作用也就消失了。
- 其它符号：如+、-、*、/等，由编译器识别，没有对应的机器码

什么是寄存器？

CPU的动力指令和数据就存放在存储器中，也就是我们平时所说的内存。CPU类似于大脑，而内存则是记忆，没有记忆也就无法进行思考。磁盘虽然也是存储设备，但是不同于内存，磁盘上的数据或程序如果不读到内存中，就无法被CPU使用。

指令和数据：在内存或磁盘上，指令和数据没有任何区别，都是二进制信息。CPU在工作的时候，把有的信息看作为指令，有的信息看作为数据，同样的二进制信息赋予了不同的意义。
- 棋盘里的黑白子，在棋盒中没有任何的区别，但是在对弈中就有了不同的意义
- 例如：1000100111011000，计算机可以把它看作大小为89D8H的数据来处理，也可以将其看作指令mov ax,bx来执行。
存储单元：存储器被划分成若干个存储单元，每个存储单元从0开始顺序编号。
- 电子计算机中最小信息单位是二进制位(bit),8个bit组成一个字节(Byte,存储器最小计算单位)。一个微机存储器有128个存储单元，它可以存储128个Byte。

CPU对存储器的读写

首先我们之前有讲到，存储器被划分成多个存储单元，存储单元从零开始顺序编号。这些编号可以看着做存储单元在存储器中的地址，类似于门牌号码。如果CPU要从内存中读数据，首先要指定存储单元的地址。也就是说它要先确定它要读取哪一个存储单元中的数据。就像找人，你要知道他住在哪。另外CPU在读写数据时还要指明，它要对哪一个器件进行操作，进行哪种操作，是从中读出数据，还是向里面写入数据。

可见与器件进行下面3类交互：
- 存储单元的地址(地址信息：告诉你应该从内存的哪块地方拿数据)
- 器件的选择，读或写的命令(控制信息：你所要做的操作)
- 读或写的数据(数据信息)

总线

CPU通过导线传输电信号，将地址、数据和控制信息传到存储芯片中。

总线从逻辑上分为：地址总线、控制总线和数据总线
- CPU通过地址线将地址信息3发出。
- CPU通过控制线发出内存读指令，选中存储信息，并通知它，将要从中读取数据。
- 存储器将3号单元中的数据8通过数据线送入CPU
CPU从3号单元中写入数据的过程：
- CPU通过地址线将地址信息3发出。
- CPU通过控制线发出内存写命令，选中存储芯片，并通知他，要向其中写入数据。
- CPU通过数据线将数据26送入内存的3号单元中。
过程图如下：

地址总线

CPU通过地址总线来指定存储器单元，可见地址总线上能够传送多少个不同信息，CPU就可以对多少个存储单元进行寻址。

现在假设有10根地址总线，那么让我们来看一下它的寻址情况：10根导线可以传送10位二进制数据，那么可以查找2^10方也就是1024个存储单元，1024个字节，那么1025个字节就无法查找到。
- 再拿X86的系统做例子：32位的系统，32根地址总线，可寻找2^32个存储单元。4,294,967,296B = 4,194,304 KB = 4096MB = 4GB，所以32位的系统最多支持4G内存。
- CPU向内存发出地址信息11时，10根到线上传送的二进制信息：
- 一个CPU有N根地址线，则可以说这个CPU的地址总线的宽度为N。这样的CPU最多可以寻找2的N次方各个内存单元。

数据总线

数据总线的宽度决定了CPU和外界数据的传输速度

8根数据总线一次可以传送一个8位二进制数据，16根数据则是2个字节
- 例如8086CPU有16根数据线，可以一次传送16位数据，所以可以一次传输数据89D8H；而8088只有8根数据线，一次只能传8位数据，所以向内存写入数据89D8H时需要进行两次数据传送。

控制总线

CPU对外部器件的控制是通过控制总线来进行的。控制总线是一些不同控制线的集合。有多少根控制总线，就意味着CPU提供了对外部器件的多少种控制。

控制总线的宽度决定了CPU对外部器件的控制能力,我们前面所讲的CPU向外传出读写信号，就是分别由两根控制总线来完成。