APUE(第三章)文件IO

本文详细介绍了Linux系统中的文件I/O操作,包括open、read、write、lseek和close等基本函数的使用,以及文件描述符的概念和作用。文件描述符是进程引用文件的关键,而openat函数的引入解决了相对路径的安全问题。文章还提到了原子操作如O_APPEND标志的追加写入,以及dup和dup2函数在文件描述符复制中的应用。此外,讨论了fsync、fdatasync和sync函数在数据同步中的功能,以及fcntl和ioctl的高级文件控制。

引言

本章主要讲文件IO包括:open、read、write、lseek以及close。这些函数通常被称为不带缓冲的IO,不带缓冲至每个read与write都有内核中的一个系统调用。这些不是ISO C的组成部分,但是是Posix.1与SUS的组成部分

本章介绍的原子操作概念十分重要

还将介绍dup、fcntl、sync、fsync、ioctl等等

文件描述符

  • 所有文件都通过文件描述符引用
  • 文件描述符是一个非负整数
  • 打开或者创建一个新文件,内核进程返回一个文件描述
  • 读写一个文件时,将其作为参数传递给read或write
  • 使用open或creat将会返回文件描述符标识文件

注意:

unix系统shell把文件描述符0与进程的标准输入关联,文件描述符1与标准输出关联,文件描述符2与标准错误关联。posix.1 0、1、2已经标准化,但在"unistd.h"中将其替换为符号常量STDIN_FILENO、STDOUT_FILENO、STDERR_FILENO,方便阅读,这是各种shell以及很多应用程序使用的惯例,与内核无关,如果不遵循此惯例,许多unix应用程序不能正常工作

文件描述符变化范围时0~OPEN_MAX-1.ubuntu20.04经过测试是1048576.测试代码如下

函数open与openat

#include <fcntl.h>
int open(const char *path,int oflag, .../*mode_t mode*/);
int openat(int fd,const char *path,int oflag, .../*mode_t mode*/);//成功返回文件描述符,失败返回-1
  • …可变参数
  • open而言,仅当创建新文件时才使用最后这个参数
  • 参数path是要打开或创建文件的名字。
  • oflag参数是说明文件是怎样打开或创建

常用如下 O_RDONLY、O_WRONLY、O_RDWR

O_EXEC执行打开

O_EXEC每次写时都追加到尾端

O_CLOEXEC

O_CREAT若此文件不存在则创建,必须指定第三个参数mode,新文件文件权限位,用umask可修改

O_DIRECTORY path必须是目录,否则出错




open与openat在有无文件描述符fd上的区别

  • path参数是绝对路径名,fd不起作用,openat==open
  • path为相对路径名,fd指出相对路径在文件系统中的地址,fd参数通过打开相对路径名所在的目录来获取
  • path为相对路径名,fd参数为AT_FDCWD。路径名在当前工作目录获取,openat与open在操作上类似

openat在posix存在的意义

  • 让线程可以使用相对路径名打开目录中的文件,不再只能打开当前工作目录
  • 避免time-of-check-to-time-of-use,TOCTTOU

文件名和路径名截断

截断顾名思义就是从中间截去一部分,保留前半部分,比如最大文件名长度为14字符,创建了一个15字符的新文件,文件名自动截断为14字符

函数creat

#include "fcntl.h"
int creat(const char *path,mode_t mode);//成功返回文件描述符,失败返回-1

此函数相当于open(path,O_WRONLY|O_CREAT|O_TRUNC,mode);只能易写的方式创建,如果创建并返回可读写的文件描述符open(path,O_RDWR|O_CREAT|O_TRUNC,mode);更好

函数close

#include <unistd.h>
int close(int fd); //成功返回0,否则返回-1

关闭一个文件,释放该进程加在该文件上所有记录锁

函数lseek

每个打开文件都有一个文件偏移量

文件偏移量

  • 一般为非负整数,也可能出现负
  • 用以度量从文件开始处计算的字节数
  • 读写操作都从文件偏移量处开始,并使偏移量增加所读写的字节数
  • 默认打开一个文件偏移量为0,从头开始读写,除非打开时有O_APPEND参数
  • 被记录在内核,不引起IO操作,用于下一次读写
  • 文件偏移量可以大于文件当前长度,这种情况对该文件下次写将加长该文件,中间形成空洞,位于文件中没被写过的字节都为0,并且不需要重新分配磁盘块
#include "unistd.h"
off_t lseek(int fd,off_t offset,int whence) //成功返回新的文件偏移量,否则-1
  • whence为SEEK_SET ,将文件偏移量设置为距离文件开始处offset个字节
  • whence为SEEK_CUR,将文件偏移量设置为当前值加上offset个字节,offset可正负
  • whence为SEEK_END ,将文件偏移量设置为文件长度加offset个字节,offset可正负

注意:文件描述符指向管道,FIFO或网络套接字,lseek返回-1,errno设置为ESPIPE

函数read

  • 使用read从打开文件中读取数据,读取nbytes个字节
#include "unistd.h"
ssize_t read(int fd,void *buf,size_t nbytes);//成功返回读到的字节数,出错返回-1
  • 普通文件,读到多少返回多少。

  • 从终端读时一次最多一行

  • 从网络读,缓冲机制可能返回值会小于所要求的字节数

  • 从管道或者FIFO读,返回实际读到的

  • 当一个信号造成中断,读取部分的数据量时

读操作从文件的当前偏移量处开始,在成功返回之前,将增加实际读到的字节数

函数write

  • 写数据
#include “unistd.h”
ssize_t write(int fd,const void *buf,size_t nbytes);// 成功返回写入字节数,出错-1

IO效率

缓冲的重要性,预读技术

文件共享

文件可以在不同进程间共享打开文件

内核使用3种数据结构表示打开文件,他们关系决定了一个进程对另一个进程的影响

  • 每个进程在**进程表都有一个记录项,记录项包含一张打开文件描述符表,矢量,每个描述符占用一项,与每个文件描述符相关联的是**
    • 文件描述符标志(close_on_exec)(FD_CLOEXEC)仅仅是一个标志,当你fork了一个子进程,然后在子进程中调用了exec函数时就用到了该标志.意义是:执行exec前是否要关闭这个文件描述符.
    • 指向一个文件表项的指针
  • 内核为所有打开文件维持一张文件表(文件表项)
    • 文件状态标志,读写添写同步非阻塞
    • 当前文件偏移量
    • 指向该文件v节点表项的指针
  • 每个打开文件(或设备)都有一个v节点(v-node)结构。
    • 包含文件类型
    • 对此文件操作的函数指针
    • 包含i节点(参考第四章)

如下图所示

原子操作

原子操作指的是由多步组成的一个操作,如果该操作执行,则要么执行完所有步骤,要么一步也不执行,不可能只执行一个子集

追加操作

O_APPEND标志就是一个,每次写之前都会定位到尾部,然后写

pread与pwrite

用open创建文件时,o_creat与o_excl搭配也是一个原子操作

函数dup与dup2

复制文件描述符

#include <unistd.h>
int dup(int fd);
int dup2(int fd,int fd2); //成功返回新的文件描述符,出错返回-1
  • dup返回当前可用文件描述符的最小值
  • dup2若fd2已经打开则关闭,若fd==fd2,不关闭它,否则,fd2的FD_CLOEXEC就会清除,fd2在调用exec函数时是打开状态

  • dup2是原子操作

  • dup2与fcntl有不同的errno

sync,fsync和fdatasync

#include <unistd.h>
int fsync(int fd);
int fdatasync(int fd);
					//成功返回0,出错返回-1
void sync(void);

函数fcntl

用来改变已经打开文件的属性

#include <fcntl.h>
int fcntl(int fd,int cmd, .../*int arg*/);
  • 复制一个已有的描述符(cmd=F_DUPFD或F_DUPFD_CLOEXEC)。

  • 获取/设置文件描述符标志(cmd=F_GETFD或F_SETFD)

  • 获取/设置文件状态标志(cmd=F_GETFL或F_SETFL)

  • 获取/设置异步IO所有权(cmd=F_GETOWN或F_SETOWN)

  • 获取/设置记录锁(cmd=F_GETLK、FSETLK或F_SETLKW)

函数ioctl

18-19章

参考:

《APUE》

文件描述符与文件描述符标志

文件描述符,文件描述符标志,文件状态标志 三个的区别和联系

Linux系统学习笔记:文件描述符标志_

文件描述符标志、文件状态标志_

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值