C语言中常用的字符串函数源码.pdf
文本预览下载声明
strtok (分解字符串为一组字符串。):位操作与空间压缩实现strtok 1/3
char * mystrtok(char * _Str, const char * _Delim); 函数可以用于分解字符串,最近看了
下这个函数的源代码,其中有
1. unsigned char map[3 ];
.
3. // Clear control map
4. for (int count = 0; count 3 ; count++)
5. {
6. map[count] = 0;
7. }
8.
9.
10. // Set bits in delimiter table
11. do
1 . {
13. map[*delim 3] |= (1 (*delim 7));
14. } while (*delim++);
这段代码非常有意思, 一眼可能不明白,为什么用个 unsigned char map[3 ]; 数组来保存分隔
字符。下面的 map[*delim 3] |= (1 (*delim 7)); 更加有点古怪。在网上查了下,并没
有文章来解释,因此写篇博客来解释说明下。
这个长为 32 的数组 (unsigned char map[3 ])与后面的左移,右移操作看起来迷惑,其实如果
看过 《位操作之基础篇》中的“3、位操作与空间压缩”便不难想到,这里其实是个位操作的空间压缩
技巧。
因此 char 类型的数据只会从 0 到 255,因此建立一个哈希表来记录哪些字符要分割,需要则标记为
1,否则标记为 0,然后在分隔字符串时,就能直接判断字符串的该位置是否要分割。
详细请见 mystrtok 的实现。
1. /*
. * char * mystrtok(char * _Str, const char * _Delim);
3. * 分解字符串为一组字符串。_Str为要分解的字符串,_Delim为分隔符字符串。
4. */
5. #define _CRT_SECURE_NO_WARNINGS
6. #includestdio.h
7. #includestdlib.h
8. #includestring.h
9.
10. #define STRING_MAX_SIZE 10 4
11.
1 . char * mystrtok(char * _Str, const char * _Delim);
13.
14. char * mystrtok(char * _Str, const char * _Delim)
15. {
16. unsigned char * str; //存储当前分割出来的字符串
17. const unsigned char * delim = (const unsigned char *)_Delim; //分割字符串
18. static unsigned char * _Token = NULL; //分割后的字符串
19. //注意这里使用了static类型,实际的strtok函数出于线程安全会使用TLS
0.
1. //由于char类型占一个字节取值范围为0~ 55
. //所以可以打个map[ 55]这样的哈希表,
3. //但是为了节约内存,可以通过位操作,一个char类型有8位,也就是说可存储8个char类型字节,那
strtok (分解字符串为一组字符串。):位操作与空间压缩实现strtok 2/3
最终只需要map[3 ],足足节约了 3个字节。
4. unsigned char map[3 ];
5.
6. //置空map[3 ]
7. for (int count = 0; count 3 ; count++)
显示全部