引言
本章主要讲文件IO包括:open、read、write、lseek以及close。这些函数通常被称为不带缓冲的IO,不带缓冲至每个read与write都有内核中的一个系统调用。这些不是ISO C的组成部分,但是是Posix.1与SUS的组成部分
本章介绍的原子操作概念十分重要
还将介绍dup、fcntl、sync、fsync、ioctl等等
文件描述符
- 所有文件都通过文件描述符引用
- 文件描述符是一个非负整数
- 打开或者创建一个新文件,内核进程返回一个文件描述
- 读写一个文件时,将其作为参数传递给read或write
- 使用open或creat将会返回文件描述符标识文件
注意:
unix系统shell把文件描述符0与进程的标准输入关联,文件描述符1与标准输出关联,文件描述符2与标准错误关联。
posix.1 0、1、2已经标准化,但在"unistd.h"中将其替换为符号常量STDIN_FILENO、STDOUT_FILENO、STDERR_FILENO,方便阅读,这是各种shell以及很多应用程序使用的惯例,与内核无关,如果不遵循此惯例,许多unix应用程序不能正常工作。

文件描述符变化范围时0~OPEN_MAX-1.ubuntu20.04经过测试是1048576.测试代码如下

函数open与openat
#include <fcntl.h>
int open(const char *path,int oflag, .../*mode_t mode*/);
int openat(int fd,const char *path,int oflag, .../*mode_t mode*/);//成功返回文件描述符,失败返回-1
- …可变参数
- open而言,仅当创建新文件时才使用最后这个参数
- 参数path是要打开或创建文件的名字。
- oflag参数是说明文件是怎样打开或创建
常用如下 O_RDONLY、O_WRONLY、O_RDWR
O_EXEC执行打开
O_EXEC每次写时都追加到尾端
O_CLOEXEC
O_CREAT若此文件不存在则创建,必须指定第三个参数mode,新文件文件权限位,用umask可修改
O_DIRECTORY path必须是目录,否则出错




open与openat在有无文件描述符fd上的区别
- path参数是绝对路径名,fd不起作用,openat==open
- path为相对路径名,fd指出相对路径在文件系统中的地址,fd参数通过打开相对路径名所在的目录来获取
- path为相对路径名,fd参数为AT_FDCWD。路径名在当前工作目录获取,openat与open在操作上类似
openat在posix存在的意义
- 让线程可以使用相对路径名打开目录中的文件,不再只能打开当前工作目录
- 避免time-of-check-to-time-of-use,TOCTTOU

文件名和路径名截断
截断顾名思义就是从中间截去一部分,保留前半部分,比如最大文件名长度为14字符,创建了一个15字符的新文件,文件名自动截断为14字符


函数creat
#include "fcntl.h"
int creat(const char *path,mode_t mode);//成功返回文件描述符,失败返回-1
此函数相当于open(path,O_WRONLY|O_CREAT|O_TRUNC,mode);只能易写的方式创建,如果创建并返回可读写的文件描述符open(path,O_RDWR|O_CREAT|O_TRUNC,mode);更好
函数close
#include <unistd.h>
int close(int fd); //成功返回0,否则返回-1
关闭一个文件,释放该进程加在该文件上所有记录锁
函数lseek
每个打开文件都有一个文件偏移量
文件偏移量
- 一般为非负整数,也可能出现负
- 用以度量从文件开始处计算的字节数
- 读写操作都从文件偏移量处开始,并使偏移量增加所读写的字节数
- 默认打开一个文件偏移量为0,从头开始读写,除非打开时有O_APPEND参数
- 被记录在内核,不引起IO操作,用于下一次读写
- 文件偏移量可以大于文件当前长度,这种情况对该文件下次写将加长该文件,中间形成空洞,位于文件中没被写过的字节都为0,并且不需要重新分配磁盘块
#include "unistd.h"
off_t lseek(int fd,off_t offset,int whence) //成功返回新的文件偏移量,否则-1
- whence为SEEK_SET ,将文件偏移量设置为距离文件开始处offset个字节
- whence为SEEK_CUR,将文件偏移量设置为当前值加上offset个字节,offset可正负
- whence为SEEK_END ,将文件偏移量设置为文件长度加offset个字节,offset可正负
注意:文件描述符指向管道,FIFO或网络套接字,lseek返回-1,errno设置为ESPIPE


函数read
- 使用read从打开文件中读取数据,读取nbytes个字节
#include "unistd.h"
ssize_t read(int fd,void *buf,size_t nbytes);//成功返回读到的字节数,出错返回-1
-
普通文件,读到多少返回多少。
-
从终端读时一次最多一行
-
从网络读,缓冲机制可能返回值会小于所要求的字节数
-
从管道或者FIFO读,返回实际读到的
-
当一个信号造成中断,读取部分的数据量时
读操作从文件的当前偏移量处开始,在成功返回之前,将增加实际读到的字节数
函数write
- 写数据
#include “unistd.h”
ssize_t write(int fd,const void *buf,size_t nbytes);// 成功返回写入字节数,出错-1
IO效率
缓冲的重要性,预读技术
文件共享
文件可以在不同进程间共享打开文件
内核使用3种数据结构表示打开文件,他们关系决定了一个进程对另一个进程的影响
- 每个进程在**
进程表都有一个记录项,记录项包含一张打开文件描述符表,矢量,每个描述符占用一项,与每个文件描述符相关联的是**- 文件描述符标志(close_on_exec)(FD_CLOEXEC)
仅仅是一个标志,当你fork了一个子进程,然后在子进程中调用了exec函数时就用到了该标志.意义是:执行exec前是否要关闭这个文件描述符. - 指向一个文件表项的指针
- 文件描述符标志(close_on_exec)(FD_CLOEXEC)
- 内核为所有打开文件维持一张文件表(文件表项)
- 文件状态标志,读写添写同步非阻塞
- 当前文件偏移量
- 指向该文件v节点表项的指针
- 每个打开文件(或设备)都有一个v节点(v-node)结构。
- 包含文件类型
- 对此文件操作的函数指针
- 包含i节点(参考第四章)
如下图所示

原子操作
原子操作指的是由多步组成的一个操作,如果该操作执行,则要么执行完所有步骤,要么一步也不执行,不可能只执行一个子集
追加操作
O_APPEND标志就是一个,每次写之前都会定位到尾部,然后写
pread与pwrite

用open创建文件时,o_creat与o_excl搭配也是一个原子操作
函数dup与dup2
复制文件描述符
#include <unistd.h>
int dup(int fd);
int dup2(int fd,int fd2); //成功返回新的文件描述符,出错返回-1
- dup返回当前可用文件描述符的最小值
- dup2若fd2已经打开则关闭,若fd==fd2,不关闭它,否则,fd2的FD_CLOEXEC就会清除,fd2在调用exec函数时是打开状态


-
dup2是原子操作
-
dup2与fcntl有不同的errno
sync,fsync和fdatasync

#include <unistd.h>
int fsync(int fd);
int fdatasync(int fd);
//成功返回0,出错返回-1
void sync(void);

函数fcntl
用来改变已经打开文件的属性
#include <fcntl.h>
int fcntl(int fd,int cmd, .../*int arg*/);
-
复制一个已有的描述符(cmd=F_DUPFD或F_DUPFD_CLOEXEC)。

-
获取/设置文件描述符标志(cmd=F_GETFD或F_SETFD)

-
获取/设置文件状态标志(cmd=F_GETFL或F_SETFL)


-
获取/设置异步IO所有权(cmd=F_GETOWN或F_SETOWN)


-
获取/设置记录锁(cmd=F_GETLK、FSETLK或F_SETLKW)
函数ioctl
18-19章
参考:
《APUE》
本文详细介绍了Linux系统中的文件I/O操作,包括open、read、write、lseek和close等基本函数的使用,以及文件描述符的概念和作用。文件描述符是进程引用文件的关键,而openat函数的引入解决了相对路径的安全问题。文章还提到了原子操作如O_APPEND标志的追加写入,以及dup和dup2函数在文件描述符复制中的应用。此外,讨论了fsync、fdatasync和sync函数在数据同步中的功能,以及fcntl和ioctl的高级文件控制。
1228

被折叠的 条评论
为什么被折叠?



