源代码转换成二进制指令，编程语言有何不同？

网络整理 2023-10-02 14:03

编译型和解释型

摘自语言中文网-phthon-phthon编程基础

我们编撰的源代码是人类语言，我们自己就能轻松理解；但是对于计算机硬件（CPU），源代码就是天书，根本难以执行，计算机只能辨识个别特定的二进制指令，在程序真正运行之前必须将源代码转换成二进制指令。

所谓的二进制指令，也就是机器码，是 CPU 能够辨识的硬件层面的“代码”，简陋的硬件（比如古老的单片机）只能使用几十个指令，强大的硬件（PC 和智能手机）能使用成百上千个指令。

然而，究竟在什么时候将源代码转换成二进制指令呢？不同的编程语言有不同的规定：

简单理解，编译器就是一个“翻译工具”，类似于将英文翻译成英文、将中文翻译成泰文。但是，翻译源代码是一个复杂的过程，大致包括词法分析、语法剖析、语义剖析、性能优化、生成可执行文件等五个步骤，期间涉及到复杂的算法和硬件构架。解释器与此类似，有兴趣的读者请参考《编译原理》一书，本文不再赘言。

Java 和 C# 是一种比较雷人的存在，它们是半编译半解释型的语言，源代码须要先转换成一种中间文件（字节码文件），然后再将中间文件领到虚拟机中执行。Java 引领了这些热潮，它的本意是在跨平台的同时兼具执行效率；C# 是后来的跟随者，但是 C# 一直止步于 Windows 平台，在其它平台鲜有作为。

那么，编译型语言和解释型语言各有哪些特征呢？它们之间有哪些区别？

编译型语言

对于编译型语言，开发完成之后须要将所有的源代码都转换成可执行程序，比如 Windows 下的.exe文件，可执行程序上面包含的就是机器码。只要我们拥有可执行程序，就可以随时运行，不用再重新编译了，也就是“一次编译，无限次运行”。

在运行的时侯，我们只须要编译生成的可执行程序，不再须要源代码和编译器了，所以说编译型语言可以脱离开发环境运行。

编译型语言通常是不能跨平台的，也就是不能在不同的操作系统之间随便切换。

编译型语言不能跨平台表现在两个方面：

1) 可执行程序不能跨平台

可执行程序不能跨平台很容易理解，因为不同操作系统对可执行文件的内部结构有着截然不同的要求，彼此之间也不能兼容。不能跨平台是天经地义，能跨平台反倒才是雷人。

比如，不能将 Windows 下的可执行程序领到 Linux 下使用，也不能将 Linux 下的可执行程序领到 Mac OS 下使用（虽然它们都是类 Unix 系统）。

另外，相同操作系统的不同版本之间也不一定兼容，比如不能将 x64 程序（Windows 64 位程序）拿到 x86 平台（Windows 32 位平台）下运行。但是反之通常可行，因为 64 位 Windows 对 32 位程序作了挺好的兼容性处理。

2) 源代码不能跨平台

不同平台支持的函数、类型、变量等都可能不同，基于某个平台编撰的源代码通常不能领到另一个平台下编译。我们以C语言为例来说明。

【实例1】在C语言中要想让程序暂停可以使用“睡眠”函数，在 Windows 平台下该函数是 Sleep()，在 Linux 平台下该函数是 sleep()，首字母大小写不同。其次，Sleep() 的参数是微秒，sleep() 的参数是秒，单位也不一样。

以上两个诱因引起使用暂停功能的C语言程序不能跨平台，除非在代码层面作出兼容性处理，非常麻烦。

【实例2】虽然不同平台的C语言都支持 long 类型，但是不同平台的 long 的宽度却不同，例如，Windows 64 位平台下的 long 占用 4 个字节，Linux 64 位平台下的 long 占用 8 个字节。

我们在 Linux 64 位平台下编撰代码时，将 0x2f1e4ad23 赋值给 long 类型的变量是完全没有问题的，但是这样的形参在 Windows 平台下才会造成数值溢出，让程序形成错误的运行结果。

让人困惑的，这样的错误通常不容易察觉，因为编译器不会报错，我们也记不住不同类型的取值范围。

解释型语言

对于解释型语言，每次执行程序都须要一边转换一边执行，用到什么源代码就将什么源代码转换成机器码，用不到的不进行任何处理。每次执行程序时可能使用不同的功能，这个时侯须要转换的源代码也不一样。

因为每次执行程序都须要重新转换源代码，所以解释型语言的执行效率天生就高于编译型语言，甚至存在数量级的差别。计算机的一些底层功能，或者关键算法，一般都使用 C/C++ 实现，只有在应用层面（比如网站开发、批处理、小工具等）才会使用解释型语言。

在运行解释型语言的时侯，我们一直都须要源代码和类库，所以说它未能脱离开发环境。

当我们说“下载一个程序（软件）”时，不同类型的语言有不同的涵义：

相比于编译型语言，解释型语言几乎都能跨平台，“一次编撰，到处运行”是真是存在的，而且比比皆是。那么，为什么解释型语言能够快平台呢？

这一切都要归功于类库！

我们所说的跨平台，是指源代码跨平台，而不是类库跨平台。解释器拿来将源代码转换成机器码，它就是一个可执行程序，是绝对不能跨平台的。

官方须要针对不同的平台开发不同的类库，这些类库必须要才能遵循同样的句型，识别同样的函数，完成同样的功能，只有这样，同样的代码在不同平台的执行结果才是相同的。

你看，解释型语言之所以还能跨平台，是因为有了类库这个中间层。在不同的平台下，解释器会将相同的源代码转换成不同的机器码，解释器帮助我们屏蔽了不同平台之间的差别。

关于 Python

Python 属于典型的解释型语言，所以运行 Python 程序须要类库的支持，只要你在不同的平台安装了不同的类库，你的代码就可以随时运行，不用害怕任何兼容性问题，真正的“一次编撰，到处运行”。

Python 几乎支持所有常见的平台，比如 Linux、Windows、Mac OS、Android、FreeBSD、Solaris、PocketPC 等，你所写的 Python 代码无需更改能够在这种平台上正确运行。也就是说，Python 的可移植性是很强的。

总结

我们将编译型语言和解释型语言的差别总结为下表：

类型原理优点缺点

编译型语言

通过专门的编译器，将所有源代码一次性转换成特定平台（Windows、Linux 等）执行的机器码（以可执行文件的方式存在）。

编译一次后，脱离了编译器也可以运行，并且运行效率高。

可移植性差，不够灵活。

解释型语言

由专门的类库，根据须要将部份源代码临时转换成特定平台的机器码。

跨平台性好，通过不同的类库，将相同的源代码解释成不同平台下的机器码。

一边执行一边转换，效率很低。

推荐c语言手机编译器

上一篇：小程序融入生活，玩法大揭秘下一篇：没有了

源代码转换成二进制指令，编程语言有何不同？

合作伙伴

商务合作

关于我们