C语言printf函数深入分析.pdf
C语言printf()函数深入分析
说起编程语言,C语言大家再熟悉不过。说起最简单的代码,Helloworld更是众所周
知。一条简单的printf语句便可以完成这个简单的功能,可是printf背后到底做了什么事情
呢?可能很多人不曾在意,也或许你比我还要好奇!那我们就聊聊printf背后的故事。
一、printf的代码在哪里?
显然,Helloworld的源代码需要经过编译器编译,操作系统的加载才能正确执行。而编
译器包含预编译、编译、汇编和链接四个步骤。
#includestdio.h
intmain()
{
printf(HelloWorld!\n);
return0;
}
首先,预编译器处理源代码中的宏,比如#include。预编译结束后,我们发现printf函
数的声明。
$/usr/lib/gcc/i686-linux-gnu/4.7/cc1-E-quietmain.c-omain.i
#1main.c
#1命令行
#1main.c
...
externintprintf(constchar*__restrict__format,...);
...
intmain()
{
printf(HelloWorld!\n);
return0;
}
然后编译器将高级语言程序转化为汇编代码。
$/usr/lib/gcc/i686-linux-gnu/4.7/cc1-fpreprocessed-quietmain.i-omain.s
.filemain.c
.section.rodata
.LC0:
.stringHelloWorld!
.text
.globlmain
.typemain,@function
main:
pushl%ebp
movl%esp,%ebp
andl$-16,%esp
subl$16,%esp
movl$.LC0,(%esp)
callputs
movl$0,%eax
leave
ret
.sizemain,.-main
...
我们发现printf函数调用被转化为callputs指令,而不是callprintf指令,这好像有点
出乎意料。不过不用担心,这是编译器对printf的一种优化。实践证明,对于printf的参数
如果是以\n结束的纯字符串,printf会被优化为puts函数,而字符串的结尾\n符号被消除。
除此之外,都会正常生成callprintf指令。
如果我们仍希望通过printf调用HelloWorld!\n的话,只需要按照如下方式修改即可。
不过这样做就不能在printf调用结束后立即看到打印字符串了,因为puts函数可以立即刷新
输出缓冲区。我们仍然使用puts作为例子继续阐述。
.section.rodata
.LC0:
.stringhelloworld!\n
...
callprintf
...
接下来,汇编器开始工作。将汇编文件转化为我们不能直接阅读的二进制格式——可重
定位目标文件,这里我们需要gcc工具包的objdump命令查看它的二进制信息。可是我们发
现callputs指令里保存了无效的符号地址。
$as-omain.omain.s
$objdump–dmain.o
main.o:文件格式elf32-i386
Disassembly