非常教程

C参考手册

字符串 | Strings

mbrlen

在头文件<wchar.h>中定义

size_t mbrlen(const char * s,size_t n,mbstate_t * ps);

(自C95以来)

size_t mbrlen(const char * restrict s,size_t n,mbstate_t * restrict ps);

(自C99以来)

确定多字节字符表示的大小(以字节为单位)。

这个函数相当于mbstate_t类型的内部隐藏对象的调用mbrtowc(nullptr,s,n,ps?ps:&internal),只是表达式ps只计算一次。

参数

s

-

指向多字节字符串的元素的指针

n

-

限制可以检查的s中的字节数

ps

-

指向保存转换状态的变量的指针

返回值

以下第一项适用:

  • 如果接下来的n个或更少的字节完成空字符或者s是空指针。 这两种情况都会重置转换状态,则返回0。
  • 返回完成有效多字节字符的字节数[1 ... n]
  • 如果接下来的n个字节是可能有效的多字节字符的一部分,在检查所有n个字节后仍然不完整,则返回(size_t)-2
  • 如果发生编码错误,则返回(size_t)-1 。errno的价值是EILSEQ; 转换状态是未指定的。

#include <locale.h>
#include <string.h>
#include <stdio.h>
#include <wchar.h>
 
int main(void)
{   
    // allow mbrlen() to work with UTF-8 multibyte encoding
    setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 narrow multibyte encoding
    const char* str = u8"水";
    size_t sz = strlen(str);
 
    mbstate_t mb;
    memset(&mb, 0, sizeof mb);
    int len1 = mbrlen(str, 1, &mb);
    if(len1 == -2) 
        printf("The first 1 byte of %s is an incomplete multibyte char"
               " (mbrlen returns -2)\n", str);
 
    int len2 = mbrlen(str+1, sz-1, &mb);
    printf("The remaining %zu  bytes of %s hold %d bytes of the multibyte"
           " character\n", sz-1, str, len2);
 
    printf("Attempting to call mbrlen() in the middle of %s while in initial"
           " shift state returns %zd\n", str, mbrlen(str+1, sz-1, &mb));
}

输出:

The first 1 byte of 水 is an incomplete multibyte char (mbrlen returns -2)
The remaining 2  bytes of 水 hold 2 bytes of the multibyte character
Attempting to call mbrlen() in the middle of 水 while in initial shift state returns -1

参考

  • C11标准(ISO / IEC 9899:2011):
    • 7.29.6.3.1 mbrlen函数(p:442)
  • C99标准(ISO / IEC 9899:1999):
    • 7.24.6.3.1 mbrlen函数(p:388)

扩展内容

mbrtowc(C95)

将下一个多字节字符转换为宽字符,给定状态(函数)

mblen

返回下一个多字节字符(函数)中的字节数

| mbrlen的C ++文档 |

C

C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。