本文将介绍常用的字符函数、字符串函数。文章不仅会讲清楚如何使用这些函数,还会讲清楚如何模拟实现其中的部分函数,帮助初学者更好地掌握这些函数,也顺带练习C语言语法。
一、字符分类函数
这一类函数专门用来做字符分类,也就是判断字符是什么类型。我们从C++官网上截出对这一系列函数的介绍(<cctype> (ctype.h) - C++ Reference):

他们的具体功能如下表:
| 函数 | 如果该函数的参数符合下列条件就返回“真” |
| isalnum | 是字母或数字 (a~z, A~Z, 0~9) |
| isalpha | 是字母(a~z或A~Z) |
| isblank | 是空格‘ ’或水平制表符‘\t’ |
| iscntrl | 是任何控制字符(ASCII中0~31及127这些不可打印、用来控制设备的字符) |
| isdigit | 是十进制数字(‘0’ ~ ‘9’字符) |
| isgraph | 是任何图形字符 |
| islower | 是小写字母a~z |
| isprint | 是任何可打印字符,包括图形字符和空白字符 |
| ispunct | 是标点符号,任何不属于数字或字母的图形字符(可打印) |
| isspace | 是空白字符:空格‘ ’ , 换页 ‘\f’, 换行‘\n’, 回车‘\r’, 制表符‘\t’或者垂直制表符‘\v’ |
| isupper | 是大写字母A~Z |
| isxdigit | 是十六进制数字,包括所有的十进制数字字符,小写字母a~f,大写字母A~F |
这类函数的使用方式接近,以islower为例:

使用时需包含头文件ctype.h。参数类型是int,返回值类型也是int。如果参数符合判断条件,返回一个非零整数;如果参数不符合条件,则返回0。

代码的运行结果如图,因为我们传的参数是小写c,所以系统返回了非零值2。
一个有趣的问题:明明是判断字符类型,为什么传的参数是int类型?
原因是这样的:字符判断函数本来就是给读文件、读输入时用的,而读文件函数读到尽头时会返回EOF(C语言中表示“文件结束”的特殊标记),它是值为-1的int类型常量,不能用char类型安全存储。字符判断函数要能够处理这个值,所以参数是int。而如果传进去的参数是char,在函数调用时会被隐式提升为int。
二、字符转换函数
C语言提供了两个字符转换函数:
int tolower (int c);//将参数传进去的大写字母转小写
int toupper (int c);//将参数传进去的小写字母转大写
我们写段代码练练手,将字符串中的小写字符转成大写字符:
int main()
{
char arr[] = "Test String";
int i = 0;
while (arr[i] != '\0')
{
if (islower(arr[i]))
{
arr[i] = toupper(arr[i]);
}
i++;
}
printf("%s", arr);
return 0;
}
运行结果如下:

三、strlen的使用和模拟实现
3.1strlen的使用
strlen是用来计算字符串长度的函数,参数是字符串起始位置的指针,返回值是字符串中‘\0’前面出现的字符个数“不包含'\0'”,使用需包含头文件string.h。
size_t strlen (const char * str);
注意函数的返回值是size_t,这是一个无符号的数据类型,很易错,比如下边这个例子:
#include<stdio.h>
#include<string.h>
int main()
{
const char* str1 = "abcedf";
const char* str2 = "bbb";
if (strlen(str2) - strlen(str1) > 0)
printf("大于");
else
printf("小于");
return 0;
}
按常理,3 - 6得到-3,但由于size_t是无符号类型,这里打印了“大于”:

3.2 strlen的模拟实现
接下来,我们用3种方法模拟实现一下strlen函数:
int main()
{
char arr[] = "abcdef";
size_t len1 = my_strlen1(arr);
size_t len2 = my_strlen2(arr);
size_t len3 = my_strlen3(arr);
printf("%zd\n", len1);
printf("%zd\n", len2);
printf("%zd\n", len3);
return 0;
}
3.2.1 计数器
第一种方法十分简单,我们创建一个整型变量作为计数器,然后用一个while循环去遍历字符串中的每个元素,直到‘\0’前最后一个元素为止。
size_t my_strlen1(const char* s)
{
assert(s);
int count = 0;//计数器
while (*s != '\0')
{
count++;
s++;
}
return count;
}
说明:代码中的assert函数用于确保指针不为空,使用需要包含头文件<assert.h>。
3.2.2 指针 - 指针
第二种方法利用指针运算,我们创建一个指针变量 p ,让 p 往后走直到'\0'前的最后一个元素,然后用 p 此时的位置减去字符串的初始地址,就得到了字符串的长度。
size_t my_strlen2(const char* s)
{
char* p = s;
while (*p != 0)
{
p++;
}
return p - s;
}
3.2.3 递归
第三种方法利用递归函数,字符串长度 = 1 + 字符串从第二个字符开始的长度 = 1 + 1 + 字符串从第三个字符开始的长度,以此类推。基准条件是:第一个字符是‘\0’时,返回0。
size_t my_strlen3(const char*s)
{
assert(s);
if (*s == 0)
return 0;
else
return 1 + my_strlen3(s + 1);
}
四、strcpy的使用和模拟实现
4.1 strcpy的使用
当我们想把一个字符串中的内容复制到另一个字符串中时,肯能会写出这样的代码:
int main()
{
char arr1[] = "abcdef";
char arr2[] = "xxxxxx";
arr2 = arr1;
return 0;
}
但这样写是错的,因为arr2是数组名,数组名是数组首元素的地址,是一个常量指针,不能被直接赋值。
那么如果想要把源字符串中的内容拷贝到目标空间,就要使用strcpy函数。这个函数在使用时,需要注意,目标空间必须足够大,且必须可修改。两个参数分别是目标空间的起始地址和源字符串的起始地址;返回值是目标字符串的起始地址。源字符串中的'\0'也会被拷贝到目标字符串中去。
char* strcpy(char * destination, const char * source);
4.2 strcpy的模拟实现
我们先创建指针变量ret把目标字符串的起始地址存起来,然后让指向源字符串起始位置和目标空间起始位置的两个指针往后走,直到源字符串'\0'为止。
char* my_strcpy(char* dest, const char* src)
{
assert(dest);
assert(src);
char* ret = dest;
while (*src != '\0')
{
*dest = *src;
dest++;
src++;
}
*dest = *src;//前面只拷贝了\0之前的内容,这一步要把\0也拷贝进去
return ret;
}
可以看到,为了把'\0也复制进去,我们在循环之外又补了一句,有点繁琐。为了更加简洁,这段代码可以用神奇的方式进行优化:
char* my_strcpy(char* dest, const char* src)
{
assert(dest);
assert(src);
char* ret = dest;
while (*dest++ = *src++)
{
;
}
return ret;
}
就这样,我们把拷贝操作和让两个指针往后走(++)的操作都放在了while循环条件判断的括号里,循环体里只放一个空语句。我们这样做实际是改变了循环中每个步骤的顺序,原来是“判断条件>进行拷贝>指针后移>判断条件”循环,而现在是“进行拷贝>判断条件>指针后移>进行拷贝”循环。先进行拷贝,再判断条件,这样不用写额外的代码也可以把源字符串中的‘\0’拷贝到目标空间了。
五、strcat的使用和模拟实现
5.1 strcat的使用
这个函数用于在一个字符串后面追加另一个字符串的内容。使用时需要注意的是:源字符串必须以‘\0’结束,目标字符串中也要有\0(否则不知道从哪里开始追加),目标空间必须足够大(能容纳源字符串的内容),目标空间必须可修改。参数与返回值都与strcpy十分类似,类推可知。
char * strcat ( char * destination, const char * source );
5.2 strcat的模拟实现
也与strcpy类似,本质也是把一个字符串中的内容拷贝放到另一个字符串里,只不过是从目标字符串的'\0'处开始粘贴。那我们就先用一个while循环找到目标字符串里'\0'的位置,再用另一个while循环完成拷贝。
char* my_strcat(char* dest, const char* src)
{
assert(dest && src);
char* ret = dest;
while (*dest != '\0')
dest++;
while (*dest++ = *src++)
;
return ret;
}
六、strcmp的使用和模拟实现
6.1 strcmp的使用
strcmp函数用来比较两个字符串的大小;这里的“比较”比的是两个字符串中第一个不相等的字符的ASCII码值。参数是被比较的两个字符串,如果第一个字符串小于第二个字符串,返回一个<0的整数;如果两个字符串从头到尾相等,返回0;如果第一个字符串大于第二个字符串,返回一个>0的整数。
int strcmp ( const char * str1, const char * str2 );
6.2 strcmp的模拟实现
我们只需一个字符一个字符地往后比较,直到比到不同字符时,返回(*arr1 - *arr2)的值,就符合函数的定义了。
int my_strcmp(const char* arr1, const char* arr2)
{
assert(arr1 && arr2);
while (*arr1 == *arr2)
{
if (*arr1 == '\0')
return 0;
arr1++;
arr2++;
}
return *arr1 - *arr2;
}
七、长度受限制的字符串函数
C语言的库函数中,有一系列与上述介绍过的函数十分相似的函数,只不过它们的函数名中多了一个n:
| strcpy | strncpy |
| strcat | strncat |
| strcmp | strncmp |
与前面一系列函数不同之处在于,这一系列函数有3个参数,除了两个字符串的起始地址以外,还有一个size_t类型的参数规定了操作的最大长度。以strncpy为例:
char * strncpy ( char * destination, const char * source, size_t num );
代码示例和运行结果如下:

函数名里没有n的函数不知道字符串的边界,容易导致内存越界、覆盖其他数据,十分危险(这叫缓冲区溢出,是C语言最危险的问题之一);而长度受限制的这一系列函数则被认为是相对安全的。需要注意的是,它们也不是绝对安全,比如strncpy函数拷贝了n个字符还没有遇到'\0'时,不会自动加‘\0’,需要手动补加。
八、strstr函数的使用和模拟实现
8.1 strstr函数的使用
const char * strstr ( const char * str1, const char * str2 );
函数会返回字符串str2在字符串str1中第一次出现的位置;如果str1中没有str2,就返回NULL。字符串的比较匹配不包含‘\0’字符,但是以‘\0’作为结束的标志。
8.2 strstr函数的模拟实现
我们创建两个指针变量s1和s2,让它们分别指向字符串1和2的起始位置,然后用一个while循环,让它们一个一个字符往后走,一个一个字符比较。遇到不一样的字符,或者s1和s2中某个走到了‘\0’,就跳出循环。然后我们进行一个条件判断,如果跳出循环的时候s2已经走到‘\0’了,说明我们已经在字符串1中找到了一个完整的字符串2。 此时我们要返回字符串1中出现字符串2的位置。然而此时s1已经移动到后面了,无法获取起始位置。此时我们发现,需要在每次循环开始时记下开始寻找的位置以便后续返回,我们把它储存在指针变量cur中。此后每趟查找只需让cur的值+1,就可以从下一个位置开始查找。直到cur指向‘\0’时,我们就知道字符串1中找不到字符串2,此时就返回NULL即可。
char* my_strstr(const char* str1, const char* str2)
{
const char* cur = str1;
const char* s1 = NULL;
const char* s2 = NULL;
while (*cur)
{
s1 = cur;
s2 = str2;
while (*s1 == *s2 && *s2 != '\0' && *s1 != '\0')
{
s1++;
s2++;
}
if(* s2 == '\0')
{
return(char*)cur;
}
cur++;
}
return NULL;
}
九、strtok函数的使用
char * strtok ( char * str, const char * delimiters );
这个函数用来把字符串按照自己规定的分隔符分成几段。第一个参数是待分割的字符串,第二个参数是由自己规定的分隔符组成的字符串。被调用时,strtok首先从待分割的字符串里找到分隔符,将这个分隔符改成‘\0’,并返回当前这个小片段的开头地址。同时,函数会记录这个分隔符在字符串中的位置。当strtok的第一个参数为NULL时,函数将在同一个字符串中被保存的位置开始查找下一个标记。如果字符串中不存在更多的标记,则返回NULL指针。
示例代码和运行结果如下:

十、strerror 函数的使用
char * strerror ( int errnum );
sterror函数可以把参数部分错误码对应的错误信息的字符串地址返回来。
系统规定了一些错误码,C语言中错误码放在errno.h这个头文件中说明,C语言程序启动时就会使用一个全局变量errno来记录程序当前的错误码。使用标准库中的函数时发生了某种错误,就会将对应的错误码存放在errno中。错误码是整数,很难理解是什么意思,所以我们可以用sterror函数获取错误码对应的错误信息的字符串地址。
我们把1-10对应的错误信息字符串打出来看看:

也可以用perror函数,这个函数打印完参数部分的字符串后,再打印一个冒号和一个空格,再打印错误信息。示例代码和运行结果如下:

以上就是文章的全部内容。
1143

被折叠的 条评论
为什么被折叠?



