概念
通用网关接口(Common Gateway Interface/CGI)是一种重要的互联网技术,可以让一个客户端,从网页浏览器向执行在网络服务器上的程序请求数据。CGI描述了服务器和请求处理程序之间传输数据的一种标准。
运行
CGI的一个目的是要独立于任何语言的。Web服务器无须在这个问题上对语言有任何了解。事实上,CGI程序可以用任何脚步语言或者是完全独立编程语言实现,只要这个语言可以在这个系统上运行,以及有标准的输入输出和读取环境变量。
实现维基百科编辑的CGI程序的一个例子:
- 首先用户代理程序向这个CGI程序请求某个名称的条目,如果该条目页面存在,CGI程序就会去获取那个条目的原始数据,然后把它转换成HTML并把结果输出给浏览器;
- 如果该条目页面不存在,CGI程序则会提示用户新建一个页面。所有维基操作都是通过这个CGI程序来处理的。
CGI的工作方式,从Web服务器的角度看,是在特定的位置定义了可以运行CGI程序。当收到一个匹配URL的请求,相应的程序就会被调用,并将客户端发送的数据作为输入。程序的输出会由Web服务器收集,并加上合适的档头,再发送回客户端。
一般每次的CGI请求都需要新生成一个程序的副本来运行,这样大的工作量会很快将服务器压垮,因此一些更有效的技术像mod_perl,可以让脚本脚本解释器直接作为模块集成在Web服务器中,这样就能避免重复载入和初始化解释器。不过这只是就那些需要解释器的高级语言而言的,使用诸如C一类的编译语言则可以避免这种额外负荷。由于C及其他编译语言的程序与解释语言程序相比,前者的运行速度更快、对操作系统的负荷更小,使用编译语言程序是可能达到更高执行效率的,然而因为开发效率等原因,在目前直译性语言还是最适合的。
变通方法
如果代码只是偶尔改变的话,我们可以在服务器产生一个新的进程在编译代码之前进行处理。有一个例子是FastCGI,当然还包括其他编写的加速器,它会在第一次调用脚本时,在系统的某个地方保存脚本编译过的版本。这样对这个文件以后的请求就会自动转向这个编译过的代码,而不用每次调用脚本解释器来解释脚步。当更改了脚步,加速器的临时缓存会被清空来保证调用的是新的版本的脚本。
另一种方法是直接把解释器发在Web服务器中,这样就无须新建一个进程来执行脚本。