【C语言】字符串函数和内存函数
迪丽瓦拉
2025-05-29 05:48:48
0
  1. 前言🌸

在我们编写C程序时,除了使用自定义函数,往往还会使用一些库函数,例如标准输入输出函数printf,scanf,字符串函数strlen,内存函数memset等等,使用这些系统自带的库函数可以轻松地帮我们实现预期的功能,大大提升我们编程的效率。

1.本期我们将介绍库里面一些常见的字符串函数以及内存函数。
2.本期的目标时在学会使用这些库函数的同时了解其内部原理,并学会模拟实现相应的函数。
温馨提示:可以使用目录跳转到对应函数

2. 字符串函数🌊

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在
常量字符串或者字符数组中。
字符串常量适用于那些对它不做修改的字符串函数.
与字符串有关的函数放在string.h头文件中,使用前要包含对应头文件。

2.1 strlen

2.1.1 基本使用

strlen想必我们都已经很熟悉了,作用是统计字符串的长度,函数原型及说明如下:

  • 字符串以'\0'作为结束标志,strlen返回的是字符串在'\0'前面出现字符的个数(不包含'\0')

  • 参数指向的字符串必须以'\0'结束,否则最后的值为随机值

  • strlen的返回值是size_t类型,是无符号整形,这也是最容易忽略的地方。


我们可以这样使用它:

#include
int main()
{char arr1[] = "hello world";printf("%d", strlen(arr1));//求arr1数组中字符串的长度
}

程序输出11,说明其不会统计'\0',遇到'\0'结束统计:

2.1.2 模拟实现

法一:创建一个临时变量作为计数器
#include
#include
int my_strlen(const char* str)
{assert(str);//保证传入的指针不为空int count = 0;//计数器while (*str++ != '\0')//统计字符,不统计'\0'{count++;}return count;
}
int main()
{char arr1[] = "hello world";printf("%d", my_strlen(arr1));
}
法二:使用递归的方式
#include
#include
int my_strlen(const char* str)
{assert(str);//保证传入的指针不为空if (*str == '\0')//递归终点{return 0;}else{return 1 + my_strlen(str+1);}
}
int main()
{char arr1[] = "hello world";printf("%d", my_strlen(arr1));
}
法三:采用指针-指针的方式,两个指针相减得到的结果即为中间的元素个数。
#include
#include
int my_strlen(const char* str)
{assert(str);//保证传入的指针不为空const char* p = str;//将p指向字符串末尾的'\0'while (*++p){;}return p - str;//差值即为元素个数
}
int main()
{char arr1[] = "hello world";printf("%d", my_strlen(arr1));
}

三种方法运行结果都如下:

2.2 strcpy

2.2.1 基本使用

顾名思义,strcpy的作用就是拷贝字符串,它的函数原型及说明如下:

  • 源字符串必须以 '\0' 结束。

  • 对源字符串加上const修饰避免被意外修改

  • 函数会将源字符串中的 '\0' 拷贝到目标空间。

  • 目标空间必须足够大,以确保能存放源字符串,这是程序员所需要注意的。

  • 目标空间必须可变


因此我们可以这样使用它:

#include
#include
int main()
{char arr1[] = "hello world";char arr2[20] = { 0 };printf("%s", strcpy(arr2, arr1));//由于返回的是拷贝后数组的首元素地址,因此可以进行随机访问
}

2.2.2 模拟实现

我们可以通过指针将每个字符逐一拷贝到目标数组('\0'也要拷贝),代码即效果如下:
#include
#include
char* my_strcpy(char* dest, const char* src)
{assert(dest && src); //断言,保证代码健壮性char* ret = dest; //保存起始地址,用于返回//将src的字符逐个拷贝到dest中,包括'\0'while (*dest++ = *src++){;}return ret;
}
int main()
{char arr1[] = "hello world";char arr2[20] = { 0 };printf("%s", my_strcpy(arr2, arr1)); //返回拷贝后的数组,支持链式访问
}

2.3 strcat

2.3.1 基本使用

strcat的作用是追加字符串,将一个字符串追加到令一个字符串的末尾,函数原型及说明如下:

  • 源字符串必须以 '\0' 结束。否则我们不知道什么时候追加结束

  • 目标字符串也必须以'\0'结束,否则我们不知道什么时候开始追加

  • 目标空间必须有足够的大,能容纳下源字符串的内容。

  • 不能自己追加自己。这是由于开始追加会将目标空间末尾的'\0'覆盖,如果自己追加自己,相当于源字符串末尾的'\0'被覆盖了,从而失去了停止的标志,会陷入死循环。


因此我们可以这样使用它:

#include
#include
int main()
{char str1[20] = "hello ";char str2[] = "world";printf("%s", strcat(str1, str2));return 0;
}

2.3.2 模拟实现

我们可以先找到目标字符串的末尾,然后从此处开始将源字符串的字符拷贝到目标字符串中。代码如下:
#include
#include
//模拟实现strcat
char* my_strcat(char* dest, const char* src)
{assert(dest && src);//断言,保证代码健壮性char* ret = dest;//保存起始地址,用于返回//找到dest的末尾while (*dest){dest++;}//进行追加拷贝while (*dest++ = *src++){;}return ret;
}
int main()
{char str1[20] = "hello ";char str2[] = "world";printf("%s", my_strcat(str1, str2));return 0;
}

2.4 strcmp

2.4.1 基本使用

strcmp的作用是字符串比较,将两个字符串的字符逐一进行比较,其函数原型及说明如下:

  • 由于传入的两个字符串只参与比较,因此加上const修饰符防止被意外修改

  • strcmp返回值为int类型。当str1str2,返回大于0的数;当str1=str2,返回0。

  • 注意,这里的两个字符串的比较并不是比较两个字符串的长度,而是比较每个字符的ASCII码值。


因此我们可以这样使用它:

#include
#include
int main()
{char str1[20] = "hello ";char str2[] = "world";char str3[20] = "bcdabc";char str4[] = "bcdabc";if (strcmp(str1,str2)==0){printf("str1 == str2");}else if(strcmp(str1, str2) > 0){printf("str1 > str2");}else{printf("str1 < str2\n");}if (strcmp(str3, str4) == 0){printf("str3 == str4");}return 0;
}

2.4.2 模拟实现

很简单,我们只需逐一比较每个字符的ASCII码值大小,如果相同则继续比较下一个字符,直到遇到'\0'即可。实现代码如下:
#include
#include
//模拟实现strcmp
int my_strcmp(const char* dest, const char* src)
{assert(dest && src);while (*dest == *src)//当前字符相等{if (*dest == '\0'){//全部字符都相等,两个字符串相等return 0;}//指向下一字符dest++;src++;}//不相等,返回ASCII码差值return *dest - *src;
}

2.5 strncpy

2.5.1 基本使用

strncpy的作用也是拷贝字符串。strncpy与strcpy不同的是,它是受指定长度限制的函数,即我们可以指定需要拷贝多少个字符,它的函数原型如下:

  • 与strcpy相比,参数只多了一个num,num代表要拷贝的字符数。从源字符串拷贝num个字符到目标空间

  • 如果num少于源字符的个数,其拷贝后不会在目标的后面加上'\0'。

  • 如果num超过源字符个数,则拷贝完源字符串之后,会在目标的后边追加'\0',直到总共拷贝num个。

  • 以上两点简单来说就是:strncpy我们指定拷贝多少个其就会拷贝多少个,不会凭空增加也不会凭空消失。


我们可以这样使用它:

#include
#include
int main()
{char str1[20] = "hello ";char str2[] = "world";char str3[20] = "hello ";char str4[] = "world";printf("%s\n", strncpy(str1, str2,6));//拷贝6个字符包括\0,因此会打印worldprintf("%s", strncpy(str3, str4, 3));//拷贝3个字符不包括\0,因此会打印worlo 

2.6 strncat

2.6.1 基本使用

strncat的作用也是追加字符串。同样的,和strcat不同的是,它是也是受指定长度限制的函数,即我们可以指定需要追加多少个字符,它的函数原型如下:

  • 与strncpy类似,num代表需要追加的字符数。从源字符串拷贝num个字符到目标空间

  • 如果num少于源字符个数,其追加后还会在目标空间的后面加上'\0'

  • 如果num大于源字符串的长度,超过的部分不会像strncpy一样用'\0'填充,而是直接停止。


我们可以这样使用它:

#include
#include
int main()
{char str1[20] = "hello ";char str2[] = "world";printf("%s\n", strncat(str1, str2,5));//将5个字符拷贝过去,并在后面补上'\0'return 0;
}

2.7 strncmp

2.7.1 基本使用

相同道理,strncmp也是受指定长度限制的函数,它的功能为字符串比较。我们可以指定需要比较多少个字符,它的函数原型如下:

  • 同理,num代表需要比较的字符数。比较到出现某个字符不一样或者一个字符串结束或者num个字符全部比较完。

  • 返回值与strcmp一样,大于返回大于0的数,小于返回小于0的数,相等返回0。


我们可以这样使用它:

#include
#include
int main()
{char str1[20] = "hello ";char str2[] = "world";char str3[20] = "bcdabc";char str4[] = "bc";if (strncmp(str1, str2, 2) != 0)//比较前两个字符,he与wo{printf("str1和str2前两个字符不相等\n");}if (strncmp(str3, str4, 2) == 0)//比较前两个字符,bc与bc{printf("str3和str4前两个字符相等\n");}return 0;
}

2.8 strstr

2.8.1 基本使用

这个函数可能会有人感到陌生,它的作用是在一个字符串中查找是否存在另一个字符串,它的函数原型如下:

  • 本函数从str1中查找是否存在和str2匹配的子串,如果存在,则返回第一次匹配成功的字符串首地址


我们可以这样使用它:

#include
#include
int main()
{char str1[20] = "hello ";char str2[] = "el";char str3[20] = "bcdabc";char str4[] = "ad";printf("%s\n", strstr(str1, str2));//由于str1中存在字串与str2一致,因此返回第一次匹配成功的字符串地址printf("%s\n", strstr(str3, str4));//由于str3中不存在字串与str4一致,返回NULLreturn 0;
}

2.8.2 模拟实现

法一:暴力查找。通过遍历查找str1中与str2[0]相等的字符,找到后就向后进行匹配,如果匹配成功则返回对应地址,如果匹配失败则继续向后查找下一个与str2[0]相等的字符,循环直到匹配成功或者数组遍历完毕。动态效果及代码如下:
#include
#include
#include
//模拟实现strstr,暴力法
char* my_strstr(const char* dest, const char* src)
{assert(dest && src);char* p1 = NULL;char* p2 = NULL;char* cp = (char*)dest;while (*cp){p1 = cp;p2 = (char*)src;//开始匹配while (*p1 && *p2 && *p1 == *p2){p1++;p2++;}//全部字符匹配成功if (*p2 == '\0'){return cp;}//匹配失败,继续向后遍历查找cp++;}return NULL;//找不到返回空
}
法二:KMP算法。这是一种字符串匹配算法,后续会专门用一篇博客写KMP算法的思想与实现,这里就直接上代码:
#include
#include
#include
#include
int* get_next(const char*src)
{assert(src && *src);int sl = strlen(src);int* next=(int*)malloc((sl+1) * sizeof(int));//赋初值,第一个字符的最长公共前后缀为0next[1] = 0;next[0] = -1;//开始遍历,对next[j]赋值,j表示第j位字符int i = 0;int j = 2;while (j <= sl){if (i == -1||src[i] == src[j-1]) {next[j] = i + 1; //最长公共前后缀i++;j++;}else  //不相等,通过next回溯i{i = next[i];}}return next;
}
char* my_strstr_KMP(const char* dest, const char* src)
{int* next=get_next(src);int i = 0;int j = 0;while (dest[i]){if (j == -1 || dest[i] == src[j]){i++;j++;}else if (!src[j]) //遍历完毕,返回起始的地址{return &dest[i - j];}else  //通过next回溯j{j = next[j];}}return NULL;
}
int main()
{char str1[20] = "hello ";char str2[] = "el";char str3[20] = "bcdabc";char str4[] = "ad";printf("%s\n",my_strstr_KMP(str1,str2));printf("%s", my_strstr_KMP(str3, str4));return 0;
}

2.9 strtok

2.9.1 基本使用

这个函数的作用按照指定的分隔符来分隔字符串,返回分隔后的字符串,其函数原型及说明如下:

  • sep参数是个字符串,定义了用作分隔符的字符集合

  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中的一个或者多个分隔符分割的标记。

  • strtok函数会找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改,即不能是常量字符串)

  • strtok函数的第一个参数不为 NULL 时,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。

  • strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。

  • 如果字符串中不存在更多的标记,则返回 NULL 指针。


根据strtok的特性,我们可以这样使用它:

#include
int main()
{//分隔一个ip地址char str1[20] = "192.168.1.123";//源字符串char str2[20] = { 0 };char* del = ".";//分隔符strcpy(str2, str1);//由于strtok会修改源字符串,因此拷贝一份来操作//开始分隔,当返回NULL时结束for (char* s = strtok(str2, del); s != NULL; s=strtok(NULL, del)){printf("%s\n", s);}return 0;
}

2.10 strerror

2.10.1 基本使用

这个函数的作用是返回一个错误码所对应的错误信息,其函数原型与说明如下:

什么是错误码?

1.错误码是一组数字,它与系统的错误讯息建立关联,每一个错误码都对应着一个错误信息。
2.C语言在库函数调用失败时,会将错误码放在一个叫errno的变量中,没有错误则置为0。errno变量在errno.h头文件中。

因此,我们可以使用strerror根据errno的值来获取错误信息,也可以将其打印出来,如下:

#include 
#include 
#include //必须包含的头文件
int main()
{FILE* pFile;pFile = fopen("unexist.ent", "r");//以r的方式打开一个不存在的文件if (pFile == NULL){printf("%s\n", strerror(errno));//显示错误信息}return 0;
}

2.11 其他

除以上字符串函数之外,在C语言的ctype.h头文件中还有一些十分好用的字符函数

2.11.1 字符分类函数

函数

如果参数符合下列条件就返回真,否则返回假

iscntrl()

任何控制字符

isspace()

空白字符:空格‘ ’,换页‘\f’,换行'\n',回车‘\r’,制表符'\t'或者垂直制表符'\v'

isdigit()

十进制数字 0~9字符

isxdigit()

十六进制数字,包括所有十进制数字,小写字母a~f,大写字母A~F

islower()

小写字母a~z

isupper()

大写字母A~Z

isalpha()

字母a~z或A~Z

isalnum()

字母或者数字,a~z,A~Z,0~9

ispunct()

标点符号,任何不属于数字或者字母的图形字符(可打印)

isgraph()

任何图形字符

isprint()

任何可打印字符,包括图形字符和空白字符

2.11.2 字符转换函数

int tolower ( int c );//将大写字母转换为小写字母int toupper ( int c );//将小写字母转换为大写字母

2.11.3 示例

#include
#include
#include
int main()
{//字符转换函数int i = 0;char str[] = "Hello WorLd";//将str的大写字符转换为小写字符while (str[i]){if (isupper(str[i]))//是大写字符{str[i] = tolower(str[i]);//转换为小写}i++;}printf("%s", str);return 0;
}

3. 内存函数🌟

以上我们介绍的函数都是用来操作字符串或者字符数组的。而当我们需要操作整形数组,操作结构体数组时,以上函数就失效了,那怎么办呢?下面就要请到我们的内存操作函数了,内存操作函数都定义在stdlib.h头文件中。

3.1 memcpy

3.1.1 基本使用

memcpy的作用是以字节为单位拷贝内存块,其函数原型及说明如下:

  • 参数的指针用void*来接收是由于设计者并不知道用户将来会传入什么类型的数据

  • 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。

  • 这个函数在遇到 '\0' 的时候并不会停下来。

  • 如果source和destination有任何的重叠,复制的结果都是未定义的,这是由于内存重叠时进行拷贝可能会覆盖尚未拷贝的数据。在不同的编译器下,发生的效果可能会意想不到。如果真的需要拷贝,请使用memmove()函数。


我们可以这样使用它:

#include
#include
int main()
{int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };int arr2[10] = { 0 };memcpy(arr2, arr1,40);//从arr1拷贝40个字节到arr2//my_memmove(arr1, arr1+4, 16);for (int i = 0; i < 10; i++){printf("%d ", arr2[i]);//打印出arr2元素}return 0;
}

3.1.2 模拟实现

很简单,由于char*类型的指针每次解引用访问一个字节,我们只需将传入的指针强转为char*指针,然后依次解引用拷贝num个字节到目标数组即可。代码如下:
#include
#include
#include
void* my_memcpy(void* dest, void* src, size_t num)
{assert(dest && src);//保证传入的指针不为空void* ret = dest;//用于返回while (num--)//拷贝num个字节{//利用char*指针的特性逐一进行拷贝*(char*)dest = *(char*)src;dest = (char*)dest + 1;src = (char*)src + 1;}return dest;
}

3.2 memmove

3.2.1 基本使用

memmove的作用是以字节为单位移动内存块的数据到目标空间。听起来与memcpy没有什么差别,但是memmove对内存块重叠的情况进行了特殊处理,使其可以正确进行拷贝。其函数原型及说明如下:

  • 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。

  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理。


我们可以这样使用它:

#include
#include
#include
int main()
{int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };int arr2[10] = { 0 };memmove(arr2, arr1, 40);//内存块不重叠for (int i = 0; i < 10; i++){printf("%d ", arr2[i]);//打印出arr2元素}memmove(arr1+2, arr1, 16);//内存块重叠,将1,2,3,4移动到arr+2处printf("\n");for (int i = 0; i < 10; i++){printf("%d ", arr1[i]);//打印出arr1元素}return 0;
}

我们可以看到无论内存块有没有重叠,都能正确的拷贝:

3.2.2 模拟实现

分为以下三种情况:

  1. 内存块不重叠

这种情况最好办,就是一般情况,无论从前开始移动还是从后开始移动都不影响结果。

  1. 内存块重叠且dest在src后

这种情况我们就不能从前面开始进行移动了,而是要从后面开始移动,我们通过动图来解释:

  1. 内存块重叠且dest在src前

而对于这种情况,我们从后面开始移动就失效了,又需要从前面开始移动,动图如下:

  1. 总结

我们需要针对不同的情况选择从前开始移动还是从后开始移动。其实我们只要先记住先从重叠的部分开始移动即可。

实现的代码如下:
#include
#include
#include
void* my_memmove(void* dest, void* src, size_t num)
{assert(dest && src);//保证传入指针不为空void* ret = dest;//用于返回//dest=src,如果重叠,则重叠部分在src后面,从后开始移动。{while (num--){*((char*)dest + num) = *((char*)src + num);}}return ret;
}int main()
{int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };int arr2[10] = { 0 };my_memmove(arr2, arr1, 40);//内存块不重叠for (int i = 0; i < 10; i++){printf("%d ", arr2[i]);//打印出arr2元素}memmove(arr1+2, arr1, 16);//内存块重叠,将1,2,3,4移动到arr+2处printf("\n");for (int i = 0; i < 10; i++){printf("%d ", arr1[i]);//打印出arr1元素}return 0;
}

3.3 memcmp

3.3.1 基本使用

memcmp函数的作用是以字节为单位对内存空间中的数据进行比较,其函数原型及说明如下:

  • 其比较从ptr1和ptr2指针开始的num个字节

  • 它的返回值如下:


我们可以这么使用它:

#include
#include
#include
int main()
{int arr1[] = { 1,2,3,4 };int arr2[] = { 1,2,4,4 };int n;n = memcmp(arr1, arr2, sizeof(arr1));//比较16个字节if (n > 0){printf("arr1 is greater than arr2.\n");}else if (n < 0){printf("arr1 is less than arr2.\n");}else{printf("arr1 is the same as arr2.\n");}return 0;
}

3.4 memset

3.4.1 基本使用

memset函数的作用是以字节为单位设置内存数据,通常用于初始化。其函数原型及说明如下:

  • 我们可以使用它对一段连续的内存空间初始化,通常置为0

  • 使用时需注意是以字节为单位进行设置内存,设置出来每个字节的值是相同的,因此在设置高字节数据具有局限性,例如整形。

  • 由于一个字符只占一个字节,因此memset也可以给字符数组进行赋值。


我们可以这样使用它:

#include
#include
int main()
{int arr[10];char str[] = "abcd";memset(arr, 0, sizeof(arr));//将整形数组初始化为0for (int i = 0; i < 10; i++){printf("%d ", arr[i]);}memset(str, 'x', 2);//将str前两个字符设置为xprintf("\n%s", str);return 0;
}

4. 写在最后

以上我们只是将一些常见的字符串函数及内存函数进行列举分析。事实上,库里面给我们提供的库函数远远不止这些,有兴趣的小伙伴们可以加以拓展。库里面的每个函数都有它的妙用,给我们带来许多便捷。并且其内部的实现方法有些也非常巧妙,仔细研究的话或许能带来意想不到的事情哦😋

以上,就是本期的全部内容啦🌸

制作不易,能否点个赞再走呢🙏

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...