非常教程

Python参考手册

字符串 | String

unicodedata

此模块提供对Unicode字符数据库的访问,该字符数据库为所有Unicode字符定义字符属性。该数据库中的数据基于UnicodeData.txt可从ftp://ftp.unicode.org/公开获得的文件版本5.2.0。

该模块使用与Unicode数据文件格式5.2.0(见http://www.unicode.org/reports/tr44/tr44-4.html)中定义的相同的名称和符号。它定义了以下功能:

unicodedata.lookup(name)

按名称查找字符。如果找到具有给定名称的字符,则返回相应的Unicode字符。如果没有找到,则提出KeyError

unicodedata.name(unichr[, default])

以字符串形式返回分配给Unicode字符unichr的名称。如果没有定义名称,则返回默认值,否则引发ValueError

unicodedata.decimal(unichr[, default])

以整数形式返回分配给Unicode字符unichr的十进制值。 如果没有定义这样的值,则返回缺省值,否则会引发ValueError。

unicodedata.digit(unichr[, default])

以整数形式返回分配给Unicode字符unichr的数字值。 如果没有定义这样的值,则返回缺省值,否则会引发ValueError。

unicodedata.numeric(unichr[, default])

以float形式返回分配给Unicode字符unichr的数字值。 如果没有定义这样的值,则返回缺省值,否则会引发ValueError。

unicodedata.category(unichr)

以字符串形式返回分配给Unicode字符unichr的常规类别。

unicodedata.bidirectional(unichr)

以字符串形式返回分配给Unicode字符unichr的双向类。如果没有定义这样的值,则返回空字符串。

unicodedata.combining(unichr)

将分配给Unicode字符unichr的规范组合类返回为整数。如果未定义组合类,则返回0

unicodedata.east_asian_width(unichr)

以字符串形式返回分配给Unicode字符unichr的东亚宽度。

2.4版本中的新功能。

unicodedata.mirrored(unichr)

以整数形式返回分配给Unicode字符unichr的镜像属性。 如果该字符在双向文本中被识别为“镜像”字符,则返回1,否则返回0。

unicodedata.decomposition(unichr)

以字符串形式返回分配给Unicode字符unichr的字符分解映射。如果没有定义这样的映射,则返回空字符串。

unicodedata.normalize(form, unistr)

返回Unicode字符串unistr的常规表单形式表单的有效值为'NFC','NFKC','NFD'和'NFKD'。

Unicode标准根据规范等价和兼容性等价的定义来定义Unicode字符串的各种规范化形式。在Unicode中,可以用各种方式表示几个字符。例如,字符U + 00C7(带有CEDILLA的拉丁大写字母C)也可以表示为序列U + 0043(拉丁文大写字母C)U + 0327(CEDILLA组合)。

对于每个字符,有两种正常形式:标准形式C和标准形式D.标准形式D(NFD)也称为规范分解,并将每个字符转换为其分解形式。标准形式C(NFC)首先应用规范分解,然后再组合预先组合的字符。

除了这两种形式外,还有两种基于兼容性等效的额外正常形式。在Unicode中,支持通常与其他字符统一的某些字符。例如,U + 2160(ROMAN NUMERAL ONE)与U + 0049(拉丁大写字母I)确实是相同的东西。但是,Unicode支持与现有字符集兼容(例如gb2312)。

标准格式KD(NFKD)将应用兼容性分解,即将所有兼容性字符替换为它们的等价物。标准形式KC(NFKC)首先应用兼容性分解,然后是规范组合。

即使两个unicode字符串被标准化,并且与人类阅读器看起来相同,如果一个字符组合了字符而另一个字符串没有,它们可能不会相等。

2.3版本的新功能。

另外,该模块公开以下常量:

unicodedata.unidata_version

此模块中使用的Unicode数据库的版本。

2.3版本的新功能。

unicodedata.ucd_3_2_0

这是一个与整个模块具有相同方法的对象,但对于需要此特定版本的Unicode数据库(如IDNA)的应用程序,则使用Unicode数据库版本3.2。

2.5版本中的新功能。

例子:

>>> import unicodedata
>>> unicodedata.lookup('LEFT CURLY BRACKET')
u'{'
>>> unicodedata.name(u'/')
'SOLIDUS'
>>> unicodedata.decimal(u'9')
9
>>> unicodedata.decimal(u'a')
Traceback (most recent call last):
  File "<stdin>", line 1, in ?
ValueError: not a decimal
>>> unicodedata.category(u'A')  # 'L'etter, 'u'ppercase
'Lu'
>>> unicodedata.bidirectional(u'\u0660') # 'A'rabic, 'N'umber
'AN'
Python

Python 是一种面向对象的解释型计算机程序设计语言,由荷兰人 Guido van Rossum 于1989年发明,第一个公开发行版发行于1991年。 Python 是纯粹的自由软件, 源代码和解释器 CPython 遵循 GPL 协议。Python 语法简洁清晰,特色之一是强制用空白符( white space )作为语句缩进。

主页 https://www.python.org/
源码 https://github.com/python/cpython
版本 2.7
发布版本 2.7.13

Python目录

1.内置常量 | Built-in Constants
2.内置例外 | Built-in Exceptions
3.内置函数 | Built-in Functions
4.内置类型 | Built-in Types
5.编译器 | Compiler
6.加密 | Cryptography
7.数据压缩 | Data Compression
8.数据持久性 | Data Persistence
9.数据类型 | Data Types
10.调试和分析 | Debugging & Profiling
11.开发工具 | Development Tools
12.文件和目录访问 | File & Directory Access
13.文件格式 | File Formats
14.构架 | Frameworks
15.输入 | Importing
16.输入/输出 | Input/ouput
17.国际化 | Internationalization
18.网络 | Internet
19.网络数据 | Internet Data
20.翻译 | Interpreters
21.语言 | Language
22.记录 | Logging
23.Mac OS
24.MS Windows
25.多媒体 | Multimedia
26.联网 | Networking
27.数字与数学 | Numeric & Mathematical
28.操作系统 | Operating System
29.可选操作系统 | Optional Operating System
30.限制执行 | Restricted Execution
31.运行 | Runtime
32.SGI IRIX
33.软件包装与分销 | Software Packaging & Distribution
34.字符串 | String
35.结构化标记 | Structured Markup
36.Tk
37.Unix
38.Python 简介
39.Python pass 语句
40.Python 循环嵌套
41.Python 运算符
42.Python log10() 函数
43.Python log() 函数
44.Python floor() 函数
45.Python fabs() 函数
46.Python exp() 函数
47.Python cmp() 函数
48.Python ceil() 函数
49.Python abs() 函数
50.Python Number(数字)
51.Python pow() 函数
52.Python modf() 函数
53.Python min() 函数
54.Python max() 函数
55.Python asin() 函数
56.Python acos() 函数
57.Python uniform() 函数
58.Python shuffle() 函数
59.Python seed() 函数
60.Python random() 函数
61.Python randrange() 函数
62.Python choice() 函数
63.Python sqrt() 函数
64.Python round() 函数
65.Python radians() 函数
66.Python degrees() 函数
67.Python tan() 函数
68.Python sin() 函数
69.Python hypot() 函数
70.Python cos() 函数
71.Python atan2() 函数
72.Python atan() 函数
73.Python 元组
74.Python 列表(List)
75.Python 字符串
76.Python 字典(Dictionary)
77.Python 日期和时间
78.Python 函数
79.Python 模块
80.Python capitalize()方法
81.Python center()方法
82.Python count() 方法
83.Python expandtabs()方法
84.Python endswith()方法
85.Python encode()方法
86.Python decode()方法
87.Python find()方法
88.Python index()方法
89.Python 异常处理
90.Python isspace()方法
91.Python isnumeric()方法
92.Python islower()方法
93.Python isdigit()方法
94.Python isalpha()方法
95.Python isalnum()方法
96.Python isupper()方法
97.Python istitle()方法
98.Python min()方法
99.Python max()方法
100.Python maketrans()方法