10 软件的安装: 编译安装和包管理器安装有什么优势和劣势?¶
今天给你带来的面试题是:编译安装和包管理器安装有什么优势和劣势 ?为了搞清楚这个问题,就引出了今天的话题,在 Linux 上如何安装程序。
在 Linux 上安装程序大概有 2 种思路:
- 直接编译源代码;
- 使用包管理器。
受开源运动影响,Linux 上很多软件都可以拿到源代码,这也是 Linux 能取得成功的一个重要原因。接下来我们先尝试用包管理器安装应用,然后再用一个实战的例子,教你如何编译安装nginx
。
包管理器使用¶
Linux 下的应用程序多数以软件包的形式发布,用户拿到对应的包之后,使用包管理器进行安装。说到包管理器,就要提到dpkg
和rpm
。
我们先说说包。 Linux 下两大主流的包就是rpm
和dpkg
。
dpkg
(debian package),是linux
一个主流的社区分支开发出来的。社区就是开源社区,有很多世界顶级的程序员会在社区贡献代码,比如 github。一般衍生于debian
的 Linux 版本都支持dpkg
,比如ubuntu
。
rpm
(redhatpackage manager)。在正式讲解之前,我们先来聊聊 RedHat 这家公司。
RedHat 是一个做 Linux 的公司,你可以把它理解成一家“保险公司”。 很多公司购买红帽的服务,是为了给自己的业务上一个保险。以防万一哪天公司内部搞不定 Linux 底层,或者底层有 Bug,再或者底层不适合当下的业务发展,需要修改等问题,红帽的工程师都可以帮企业解决。
再比如,RedHat 收购了JBoss,把 JBoss 改名为 WildFly。 像 WildFly 这种工具更多是面向企业级,比如没有大量研发团队的企业会更倾向使用成熟的技术。RedHat 公司也有自己的 Linux,就叫作 RedHat。RedHat 系比较重要的 Linux 有 RedHat/Fedora 等。
无论是dpkg
还是rpm
都抽象了自己的包格式,就是以.dpkg
或者.rpm
结尾的文件。
dpkg
和rpm
也都提供了类似的能力:
- 查询是否已经安装了某个软件包;
- 查询目前安装了什么软件包;
- 给定一个软件包,进行安装;
- 删除一个安装好的软件包。
关于dpkg
和rpm
的具体用法,你可以用man
进行学习。接下来我们聊聊yum
和apt
。
自动依赖管理¶
Linux 是一个开源生态,因此工具非常多。工具在给用户使用之前,需要先打成dpkg
或者rpm
包。 有的时候一个包会依赖很多其他的包,而dpkg
和rpm
不会对这种情况进行管理,有时候为了装一个包需要先装十几个依赖的包,过程非常艰辛!因此现在多数情况都在用yum
和apt
。
yum 你可能会说,我不用yum
也不用apt
,我只用docker
。首先给你一个连击 666,然后我还是要告诉你,如果你做docker
镜像,那么还是要用到yum
和apt
,因此还是有必要学一下。
yum
的全名是 Yellodog Updator,Modified。 看名字就知道它是基于Yellodog Updator
这款软件修改而来的一个工具。yum
是 Python 开发的,提供的是rpm
包,因此只有redhat
系的 Linux,比如 Fedora,Centos 支持yum
。yum
的主要能力就是帮你解决下载和依赖两个问题。
下载之所以是问题,是因为 Linux 生态非常庞大,有时候用户不知道该去哪里下载一款工具。比如用户想安装vim
,只需要输入sudo yum install vim
就可以安装了。yum
的服务器收集了很多linux
软件,因此yum
会帮助用户找到vim
的包。
另一方面,yum
帮助用户解决了很多依赖,比如用户安装一个软件依赖了 10 个其他的软件,yum
会把这 11 个软件一次性的装好。
关于yum
的具体用法,你可以使用man工具进行学习。 apt
接下来我们来重点说说apt
,然后再一起尝试使用。因为我这次是用ubuntu
Linux 给你教学,所以我以 apt 为例子,yum 的用法是差不多的,你可以自己 man 一下。
apt
全名是 Advanced Packaging Tools,是一个debian
及其衍生 Linux 系统下的包管理器。由于advanced
(先进)是相对于dpkg
而言的,因此它也能够提供和yum
类似的下载和依赖管理能力。比如在没有vim
的机器上,我们可以用下面的指令安装vim
。如下图所示:
然后用dpkg
指令查看 vim 的状态是ii
。第一个i
代表期望状态是已安装,第二个i
代表实际状态是已安装。
下面我们卸载vim
,再通过dpkg
查看,如下图所示:
我们看到 vim 的状态从ii
变成了rc
,r
是期望删除,c
是实际上还有配置文件遗留。 如果我们想彻底删除配置文件,可以使用apt purge
,就是彻底清除的意思,如下图所示:
再使用dpkg -l
时,vim
已经清除了。
期待结果是u
就是 unkonw(未知)说明已经没有了。实际结果是n
,就是 not-installed(未安装)。
如果想查询mysql
相关的包,可以使用apt serach mysql
,这样会看到很多和mysql
相关的包,如下图所示:
如果我们想精确查找一个叫作mysql-server
的包,可以用apt list
。
这里我们找到了mysql-server
包。
另外有时候国内的apt
服务器速度比较慢,你可以尝试使用阿里云的镜像服务器。具体可参考我下面的操作:
cat /etc/apt/sources.list
--以下是文件内容--
deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
镜像地址可以通过/etc/apt/sources.list
配置,注意focal
是我用的ubuntu
版本,你可以使用sudo lsb_release
查看自己的 Ubuntu 版本。如果你想用我上面给出的内容覆盖你的sources.list
,只需把版本号改成你自己的。注意,每个ubuntu
版本都有自己的代号。
通过上面的学习,相信你已经逐渐了解了包管理器的基本概念和使用。如果你是centos
或者fedora
,需要自己man
一下yum
。
编译安装 Nginx¶
接下来我们说说编译安装 Nginx(发音是 engine X),是一个家喻户晓的 Web 服务器。 它的发明者是俄国的伊戈尔·赛索耶夫。赛索耶夫 2002 年开始写 Nginx,主要目的是解决同一个互联网节点同时进入大量并发请求的问题。注意,大量并发请求不是大量 QPS 的意思,QPS 是吞吐量大,需要快速响应,而高并发时则需要合理安排任务调度。
后来塞索耶夫成立了 Nginx 公司, 2018 年估值到达到 4.3 亿美金。现在基本上国内大厂的 Web 服务器都是基于 Nginx,只不过进行了特殊的修改,比如淘宝用 Tengine。
下面我们再来看看源码安装,在 Linux 上获取nginx
源码,可以去搜索 Nginx 官方网站,一般都会提供源码包。
如上图所示,可以看到 nginx-1.18.0 的网址是:http://nginx.org/download/nginx-1.19.2.tar.gz。然后我们用 wget 去下载这个包。 wget 是 GNU 项目下的下载工具,GNU 是早期unix
项目的一个变种。linux
下很多工具都是从unix
继承来的,这就是开源的好处,很多工具不用再次开发了。你可能很难想象windows
下的命令工具可以在linux
下用,但是linux
下的工具却可以在任何系统中用。 因此,linux
下面的工具发展速度很快,如今已成为最受欢迎的服务器操作系统。
当然也有同学的机器上没有wget
,那么你可以用apt
安装一下。
- 第一步:下载源码。我们使用
wget
下载nginx
源码包:
可以像我这样使用cd
先切换到家目录。
- 第二步:解压。我们解压下载好的
nginx
源码包。
用ls
发现包已经存在了,然后使用tar
命令解压。
tar
是用来打包和解压用的。之所以叫作tar
是有一些历史原因:t
代表tape
(磁带);ar
是 archive(档案)。因为早期的存储介质很小,人们习惯把文件打包然后存储到磁带上,那时候unix
用的命令就是tar
。因为linux
是个开源生态,所以就沿袭下来继续使用tar
。
-x
代表 extract(提取)。-z代表gzip
,也就是解压gz
类型的文件。-v
代表 verbose(显示细节),如果你不输入-v
,就不会打印解压过程了。-f
代表 file,这里指的是要操作文件,而不是磁带。 所以tar
解压通常带有x
和f
,打包通常是c
就是 create 的意思。
- 第三步:配置和解决依赖。解压完,我们进入
nginx
的目录看一看。 如下图所示:
可以看到一个叫作configure
的文件是绿色的,也就是可执行文件。然后我们执行 configure 文件进行配置,这个配置文件来自一款叫作autoconf
的工具,也是 GNU 项目下的,说白了就是bash
(Bourne Shell)下的安装打包工具(就是个安装程序)。这个安装程序支持很多配置,你可以用./configure --help
看到所有的配置项,如下图所示:
这里有几个非常重要的配置项,叫作prefix
。prefix
配置项决定了软件的安装目录。如果不配置这个配置项,就会使用默认的安装目录。sbin-path
决定了nginx
的可执行文件的位置。conf-path
决定了nginx
配置文件的位置。我们都使用默认,然后执行./configure
,如下图所示:
autoconf
进行依赖检查的时候,报了一个错误,cc 没有找到。这是因为机器上没有安装gcc
工具,gcc 是家喻户晓的工具套件,全名是 GNU Compiler Collection——里面涵盖了包括 c/c++ 在内的多门语言的编译器。
我们用包管理器,安装gcc
,如下图所示。安装gcc
通常是安装build-essential
这个包。
安装完成之后,再执行./configure
,如下图所示:
我们看到配置程序开始执行。但是最终报了一个错误,如下图所示:
报错的内容是,nginx
的HTTP rewrite
模块,需要PCRE
库。 PCRE 是perl
语言的兼容正则表达式库。perl
语言一直以支持原生正则表达式,而受到广大编程爱好者的喜爱。我曾经看到过一个 IBM 的朋友用perl
加上wget
就实现了一个简单的爬虫。接下来,我们开始安装PCRE
。
一般这种依赖库,会叫pcre-dev
或者libpcre
。用apt
查询了一下,然后grep
。
我们看到有pcre2
也有pcre3
。这个时候可以考虑试试pcre3
。
安装完成之后再试试./configure
,提示还需要zlib
。然后我们用类似的方法解决zlib
依赖。
zlib
包的名字叫zlib1g
不太好找,需要查资料才能确定是这个名字。
我们再尝试配置,终于配置成功了。
- 第四步:编译和安装。
通常配置完之后,我们输入make && sudo make install
进行编译和安装。make
是linux
下面一个强大的构建工具。autoconf
也就是./configure
会在当前目录下生成一个 MakeFile 文件。make
会根据MakeFile
文件编译整个项目。编译完成后,能够形成和当前操作系统以及 CPU 指令集兼容的二进制可执行文件。然后再用make install
安装。&&
符号代表执行完make
再去执行make installl
。
你可以看到编译是个非常慢的活。等待了差不多 1 分钟,终于结束了。nginx
被安装到了/usr/local/nginx
中,如果需要让nginx
全局执行,可以设置一个软连接到/usr/local/bin
,具体如下:
为什么会有编译安装?¶
学完整个编译安装 Ngnix 过程后,你可能会问,为什么会有编译安装这么复杂的事情。
原来使用 C/C++ 写的程序存在一个交叉编译的问题。就是写一次程序,在很多个平台执行。而不同指令集的 CPU 指令,还有操作系统的可执行文件格式是不同的。因此,这里有非常多的现实问题需要解决。一般是由操作系统的提供方,比如 RedHat 来牵头解决这些问题。你可以用apt
等工具提供给用户已经编译好的包。apt
会自动根据用户的平台类型选择不同的包。
但如果某个包没有在平台侧注册,也没有提供某个 Linux 平台的软件包,我们就需要回退到编译安装,通过源代码直接在某个平台安装。
总结¶
这节课我们学习了在 Linux 上安装软件,简要介绍了dpkg
和rpm
,然后介绍了能够解决依赖和帮助用户下载的yum
和apt
。重点带你使用了apt
,在这个过程中看到了强大的包管理机制,今天的maven
、npm
、pip
都继承了这样一个特性。最后我们还尝试了一件高难度的事情,就是编译安装nginx
。
那么通过这节课的学习,你现在可以来回答本节关联的面试题目:编译安装和包管理安装有什么优势和劣势了吗? 老规矩,请你先在脑海里构思下给面试官的表述,并把你的思考写在留言区,然后再来看我接下来的分析。 【解析】 包管理安装很方便,但是有两点劣势。
第一点是需要提前将包编译好,因此有一个发布的过程,如果某个包没有发布版本,或者在某个平台上找不到对应的发布版本,就需要编译安装。
第二点就是如果一个软件的定制程度很高,可能会在编译阶段传入参数,比如利用configure
传入配置参数,这种时候就需要编译安装。