10.字符串和内存函数
前言: C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中 或者字符数组中。 字符串常量 适用于那些对它不做修改的字符串函数.
函数介绍:
1. strlen¶
size_t strlen ( const char * str );
#include<stdio.h>
#inlcude<string.h>
int main()
{
//a b c \0 d e f \0
char arr[] = "abc\0def";
return 0;
}
#include<stdio.h>
#include<string.h>
int main()
{
char arr[] = { 'a', 'b', 'c' };
printf("%d\n", strlen(arr));
return 0;
}
#include <stdio.h>
#include<string.h>
int main()
{
const char* str1 = "abcdef";
const char* str2 = "bbb";
if (strlen(str2) - strlen(str1) > 0)
{
printf("str2>str1\n");
}
else
{
printf("srt1>str2\n");
}
return 0;
}
//1.计数器方式
int my_strlen(const char* str)
{
int count = 0;
while (*str)
{
count++;
str++;
}
return count;
}
//2.递归:不能创建临时变量计数器
int my_strlen(const char* str)
{
if (*str == '\0')
return 0;
else
return 1 + my_strlen(str + 1);
}
//3.指针-指针的方式
int my_strlen(char* s)
{
char* p = s;
while (*p != ‘\0’)
p++;
return p - s;
}
2. strcpy¶
char* strcpy(char * destination, const char * source );
- 源字符串必须以 '\0'结束。
- 将源字符串中的 '\0'拷贝到目标空间。
#include<stdio.h> #include<string.h> int main() { char arr[10] = "xxxxxxxxx"; //const char* p = "abcdef"; char arr2[] = { 'l', 'k','\0', 't'}; //strcpy(arr, p); strcpy(arr, arr2); printf("%s\n", arr); return 0; }
- 目标空间必须足够大,以确保能存放源字符串。
#include<stdio.h> #include<string.h> int main() { char arr[3] = {0}; char arr2[] = "abcdef"; strcpy(arr, arr2); printf("%s\n", arr); return 0; }
- 目标空间必须可变。
#include<stdio.h> #include<string.h> //错误的示范 int main() { char* p = "hello world";//常量字符串 char arr2[] = "abcdef"; strcpy(p, arr2); printf("%s\n", p); return 0; }
- 模拟实现
#include<stdio.h> #include<assert.h> //错误的示范 //1.参数顺序 //2.函数的功能,停止条件 //3.assert //4.const修饰指针 //5.函数返回值 //6.题目出自《高质量C/C++编程》书籍最后的试题部分 char* my_strcpy(char* dest, const char* src) { char* ret = dest; assert(dest != NULL); assert(src != NULL); while ((*dest++ = *src++)) { ; } return ret; }
3. strcat¶
char * strcat ( char * destination, const char * source );
- 源字符串必须以 '\0'结束。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
- 字符串自己给自己追加,如何?(后续讲)
#include<stdio.h> #include<assert.h> int main() { char arr1[20] = "lkt"; strcat(arr1, arr1); //char arr1[20] = "hello "; //char arr2[] = "world"; //printf("%s\n", strcat(arr1, arr2)); return 0; }
- 模拟实现
char* my_strcat(char* dest, const char*src) { //1.找目标空间中的\0 char* cur = dest; while (*cur) { cur++; } //2.拷贝源头数据到\0之后的空间 while (*cur++ = *src++) { ; } return dest; }
4. strcmp¶
int strcmp ( const char * str1, const char * str2 );
- 标准规定:
- 第一个字符串大于第二个字符串,则返回大于0的数字
- 第一个字符串等于第二个字符串,则返回0
- 第一个字符串小于第二个字符串,则返回小于0的数字
- 那么如何判断两个字符串?
int main() { /*char arr1[] = "abcdef"; char arr2[] = "abq";*/ //char arr1[] = "abcd"; //char arr2[] = "abc"; char arr1[] = "abc"; char arr2[] = "abc"; //char arr1[] = { 'a', 'b', 'c' }; //char arr2[] = { 'a', 'b', 'c' }; int ret = my_strcmp(arr1, arr2); if (ret < 0) printf("arr1<arr2\n"); else if(ret>0) printf("arr1>arr2\n"); else printf("arr1==arr2\n"); printf("%d\n", ret); return 0; }
- 模拟实现
int my_strcmp(const char*s1, const char*s2) { assert(s1 && s2); while (*s1 == *s2) { if (*s1 == '\0') { return 0; } s1++; s2++; } //return *s1 - *s2; if (*s1 > *s2) return 1; else return -1; }
5. strncpy¶
int strncmp ( const char * str1, const char * str2, size_t num );
int main()
{
char arr1[20] = "abcdefghi";
char arr2[] = "xxxx";
strncpy(arr1, arr2, 8);
printf("%s\n", arr1);
return 0;
}
6. strncat¶
char * strncat ( char * destination, const char * source, size_t num );
#include<stdio.h>
#include<assert.h>
int main()
{
char arr1[20] = "abcdef\0qqqqqq";
char arr2[] = "xyz";
strncat(arr1, arr2, 2);
printf("%s\n", arr1);
return 0;
}
- 自己给自己添加
#include<stdio.h> #include<assert.h> int main() { char arr1[20] = "abc"; strncat(arr1, arr1, 3); printf("%s\n", arr1); return 0; }
7. strncmp¶
#include<stdio.h>
#include<assert.h>
int main()
{
int ret = strncmp("abcdef", "abc", 4);
printf("%d\n", ret);
return 0;
}
8. strstr + KMP¶
- 示例
#include<stdio.h> #include<assert.h> int main() { char arr1[] = "abcdefabcdef"; char arr2[] = "cdq"; char* p = strstr(arr1, arr2); if (p == NULL) { printf("不存在\n"); } else { printf("%s\n", p); } return 0; }
-
模拟实现(暴力版本)
#include<stdio.h> #include<assert.h> char* my_strstr(const char* str1, const char* str2) { const char* s1 = str1; const char* s2 = str2; const char* p = str1; if (*str2 == '\0') { return str1; } while (*p) { s1 = p; s2 = str2; while (*s1!='\0' && *s2!='\0' && (*s1 == *s2)) { s1++; s2++; } if (*s2 == '\0') { return (char*)p;//找到了 } p++; } return NULL;//找不到子串 }
-
模拟实现(KMP版本)
- KMP有两个字符串,主串和子串
- 主串的指针不回头,指针未为i
- 子串的指针回头,但是不是一定回到下标,这时候就需要一个next的数组,指针为j
- KMP
for (int i = 1, j = 0; i <= m; ++i) { while (j && s[i] != p[j + 1]) j = Next[j]; if (s[i] == p[j + 1]) j++; if (j >= n) { cout << i - n << " "; } }
- Next数组(递推)
- 1.next[1]=0
- 2.如果下一个字符任然相同的话,直接构成了一个更长的前后缀
- 3.如果下一个字符不同的话,直接去左边的缀去寻找共同的前后缀
- 4.回到之前的步骤
汇总:
for (int i = 2, j = 0; i <= n; ++i) { while (j && p[i] != p[j + 1]) j = Next[j]; if (p[i] == p[j + 1]) j++; Next[i] = j; }
#include<iostream> using namespace std; const int N = 1e6 + 5; char s[N], p[N];//s是主串,p是子串 int Next[N]; int main() { int n, m; cin >> n >> p + 1 >> m >> s + 1; //Next for (int i = 2, j = 0; i <= n; ++i) { while (j && p[i] != p[j + 1]) j = Next[j]; if (p[i] == p[j + 1]) j++; Next[i] = j; } int flag = false; //kmp for (int i = 1, j = 0; i <= m; ++i) { while (j && s[i] != p[j + 1]) j = Next[j]; if (s[i] == p[j + 1]) j++; if (j >= n) { flag = true; cout << i - n << " "; j = Next[j]; } } if (!flag) { cout << -1 << endl; } return 0; }
9. strtok¶
char * strtok ( char * str, const char * sep );
#include<stdio.h>
#include<string.h>
int main()
{
char arr[] = "liuketing@swpuedu.com";
char buf[200] = { 0 };
strcpy(buf, arr);
const char* p = "@.";
char* str = NULL;
for (str=strtok(buf, p); str!=NULL; str=strtok(NULL, p))
{
printf("%s\n", str);
}
return 0;
}
10. strerror¶
char * strerror ( int errnum );
#include<stdio.h>
#include<string.h>
//strerror
//把错误码转换成错误信息
int main()
{
//printf("%s\n", strerror(0));
//printf("%s\n", strerror(1));
//printf("%s\n", strerror(2));
//printf("%s\n", strerror(3));
//printf("%s\n", strerror(4));
//错误码记录到错误码的变量中
//errno - C语言提供的全局的错误变量
//#include <errno.h>
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
//perror("");//打印的依然是errno变量中错误码对应的错误信息
printf("%s\n", strerror(errno));
return 1;
}
//读文件
fclose(pf);
pf = NULL;
return 0;
}
函数 | 如果他的参数符合下列条件就返回真 |
---|---|
iscntrl | 任何控制字符 |
isspace | 空白字符:空格‘ ’,换页‘\f’,换行'\n',回车‘\r’,制表符'\t'或者垂直制表符'\v' |
isdigit | 十进制数字 0~9 |
isxdigit | 十六进制数字,包括所有十进制数字,小写字母af,大写字母AF |
islower | 小写字母a~z |
isupper | 大写字母A~Z |
isalpha | 字母az或AZ |
isalnum | 字母或者数字,az,AZ,0~9 |
ispunct | 标点符号,任何不属于数字或者字母的图形字符(可打印) |
isgraph | 任何图形字符 |
isprint | 任何可打印字符,包括图形字符和空白字符 |
字符转换:
函数 | 功能 |
---|---|
toupper | 小写转大写 |
tolower | 大写转小写 |
#include<stdio.h>
#include <ctype.h>
int main()
{
char arr[] = "Are you ok?";
char* p = arr;
while (*p)
{
if (islower(*p))
{
*p = toupper(*p);
}
p++;
}
printf("%s\n", arr);
return 0;
}
11. memcpy¶
void * memcpy ( void * destination, const void * source, size_t num );
- 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
- 这个函数在遇到 '\0' 的时候并不会停下来。
- 如果source和destination有任何的重叠,复制的结果都是未定义的。
示例:
#include<stdio.h>
#include<string.h>
int main()
{
//int arr[] = { 1,2,3,4,5,6,7,8,9,10 };
//int arr2[10] = { 0 };
//memcpy(arr2, arr, 20);
float arr1[] = { 1.0f,2.0f,3.0f,4.0f };
float arr2[5] = { 0.0 };
memcpy(arr2, arr1, 8);
return 0;
}
void* my_memcpy(void* dest, void* src, size_t num)
{
void* ret = dest;
assert(dest);
assert(src);
while(num--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
return ret;
}
12. memmove¶
- 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
- 如果源空间和目标空间出现重叠,就得使用memmove函数处理。
void* my_memmove(void* dest, void* src, size_t num)
{
void* ret = dest;
assert(dest);
assert(src);
if (dest < src)//1 前->后
{
while(num--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
}
else //2 3 后->前
{
while (num--)
{
*((char*)dest + num) = *((char*)src + num);
}
}
return ret;
}
13. memcpy¶
int memcmp ( const void * ptr1, const void * ptr2, size_t num );
#include<stdio.h>
#include<string.h>
int main()
{
int arr1[] = { 1,2,3,0,5 };//01 00 00 00 02 00 00 00 03 00 00 00 00 00 00 00 ..
int arr2[] = { 1,2,3,4,0 };//01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 00 ..
int ret = memcmp(arr1, arr2, 13);
printf("%d\n", ret);
return 0;
}