C参考手册
字符串 | Strings
mbrlen
在头文件<wchar.h>中定义 |
|
|
---|---|---|
size_t mbrlen(const char * s,size_t n,mbstate_t * ps); |
|
(自C95以来) |
size_t mbrlen(const char * restrict s,size_t n,mbstate_t * restrict ps); |
|
(自C99以来) |
确定多字节字符表示的大小(以字节为单位)。
这个函数相当于mbstate_t类型的内部隐藏对象的调用mbrtowc(nullptr,s,n,ps?ps:&internal),只是表达式ps只计算一次。
参数
s |
- |
指向多字节字符串的元素的指针 |
---|---|---|
n |
- |
限制可以检查的s中的字节数 |
ps |
- |
指向保存转换状态的变量的指针 |
返回值
以下第一项适用:
- 如果接下来的n个或更少的字节完成空字符或者s是空指针。 这两种情况都会重置转换状态,则返回0。
- 返回完成有效多字节字符的字节数[1 ... n]
- 如果接下来的n个字节是可能有效的多字节字符的一部分,在检查所有n个字节后仍然不完整,则返回(size_t)-2
- 如果发生编码错误,则返回(size_t)-1 。errno的价值是EILSEQ; 转换状态是未指定的。
例
#include <locale.h>
#include <string.h>
#include <stdio.h>
#include <wchar.h>
int main(void)
{
// allow mbrlen() to work with UTF-8 multibyte encoding
setlocale(LC_ALL, "en_US.utf8");
// UTF-8 narrow multibyte encoding
const char* str = u8"水";
size_t sz = strlen(str);
mbstate_t mb;
memset(&mb, 0, sizeof mb);
int len1 = mbrlen(str, 1, &mb);
if(len1 == -2)
printf("The first 1 byte of %s is an incomplete multibyte char"
" (mbrlen returns -2)\n", str);
int len2 = mbrlen(str+1, sz-1, &mb);
printf("The remaining %zu bytes of %s hold %d bytes of the multibyte"
" character\n", sz-1, str, len2);
printf("Attempting to call mbrlen() in the middle of %s while in initial"
" shift state returns %zd\n", str, mbrlen(str+1, sz-1, &mb));
}
输出:
The first 1 byte of 水 is an incomplete multibyte char (mbrlen returns -2)
The remaining 2 bytes of 水 hold 2 bytes of the multibyte character
Attempting to call mbrlen() in the middle of 水 while in initial shift state returns -1
参考
- C11标准(ISO / IEC 9899:2011):
- 7.29.6.3.1 mbrlen函数(p:442)
- C99标准(ISO / IEC 9899:1999):
- 7.24.6.3.1 mbrlen函数(p:388)
扩展内容
mbrtowc(C95) |
将下一个多字节字符转换为宽字符,给定状态(函数) |
---|---|
mblen |
返回下一个多字节字符(函数)中的字节数 |
| mbrlen的C ++文档 |