和这个问题有关概念的一个应用场景是:当你需要在不同操作系统平台(例如Unix和Windows)之间切换时,尤其是由一平台生成的文档在另一平台查看时,就必须搞清楚 回车”(Carriage Return, CR)和“换行”(Line Feed, LF)这两个概念之间的区别。
电脑笔记本键盘上的回车键按钮
为回答这个问题,从下面的实验开始。
在Windows下创建一个txt文档,输入’123456’六个数字并“回车enter”,
保存后,查看属性,占8个字节,即输入了八个字符,则刚才的“回车/enter”一定占了两个字节!
这两个字节是啥呢?
用UltraEdit软件打开该文件,查看这是个符号的十六进制,可得:第一个符号的ASCII码为31(十六进制),对于的符号为为数字’1’;…;第七个符号的ASCII码为 0D(十六进制),对应的符号为CR(回车);最后一个字符即第八个符号的ASCII码为 0A(十六进制),对应的符号为LF (换行)。
结论:Windows下处理回车的效果是:回车换行,即两个字符(rn ).
答案是:两个字符rn.
在Windows系统下运行下面两个程序:
程序一:
#include
void main( )
{
FILE *fp;
if((fp=fopen(“test.txt”,”w”))==NULL) {
printf(“Open the test.txt file errorn”);
}
for(int i=0;i<10;i++){
fprintf(fp,”testn”);
}
fclose(fp);
}
程序二:
#include
void main( )
{
FILE *fp;
if((fp=fopen(“test.bin”,”wb”))==NULL) {
printf(“Open the test.bin file errorn”);
}
for(int i=0;i<10;i++){
fprintf(fp,”testn”);
}
fclose(fp);
}
程序一输出文件test.txt的大小是60字节,程序二输出文件大小是50字节,用记事本打开程序一的输出没有什么问题,每行一个test. 打开程序二的输出文件test.bin时发现所有的test连成一行,test之间是一个黑色方框符号分隔。用UltraEdit-32以16进制编辑模式打开test.bin可以查看到黑色方框符号就是0A也就是n,打开test.txt则会发现换行是rn,这就是两个文件大小相差10字节的原因。Unix类系统用户打开windows中的文件就会遇到这种苦恼。
为什么会有这种区别呢?
由于Unix系统是基于C语言编写的,C语言中使用n表示换行,而在实际的文件中换行符号需要同操作系统一致,所以当我们在C中使用fopen打开一个文本文件时流实现了实际换行符与C中n之间的转换。在Windows中当用fopen打开文本文件,然后从中读到rn时流会转换为n,而当我们往文件中写入n时流会转换为rn。程序一是打开文本文件,程序二打开的是二进制文件,因为流只对文本文件进行换行表示的转换,以二进制模式打开流不会做任何处理。所以当你以二进制模式打开一个文本文件时将产生错乱,你必须亲自将rn解释为n,同样的问题也会出现在以文本模式打开二进制文件的情况.这也解释了为什么Unix类系统中的文件不区分文本文件和二进制文件的原因。
硬回车:enter
作用:换行的同时分隔段落;
在word中敲击Enter键产生的那个弯曲的小箭头,占两个字节。如下图所示:
软回车: Shift + Enter
作用:换行,但是并不换段,即前后两段文字在 Word 中属于同一“段”。在应用格式时能看出明显区别,体会到这一点。
软回车只占一个字节,在word中是一个向下的箭头。符如下图所示:
当我们需要将从网页上找到资料复制粘贴到word文档中时,经常看到软回车符号,这是因为软回车在网页设计中具有举足轻重的地位的:
软回车能使前后两行的行间距大幅度缩小,因为它不是段落标记,要和法定的段落标记——硬回车区别出来。硬回车的代码是
..
,段落的内容就夹在里面,而软回车的代码很精悍:。因此在网页中想用到软回车,只需切换到代码页面,键入软回车的代码即可。
最后,本篇笔记开始的那个问题就很明确了:“Windows(CRLF)”是编辑器对Windows系统下,“回车”操作符等效为“rn”的一个提示