Unicode字符名称的官方存储库

有几种方法可以获取所有 Unicode 字符名称的列表:例如使用 Python 模块unicodedata,如Unicode 字符名称列表中所述,或使用网站:https : //unicode.org/charts/charindex.html但这里不完整,您必须打开并解析 PDF 才能找到名称。

但是所有 Unicode 字符名称的官方来源/存储库是什么?(这样如果添加了新字符,列表就会更新,所以我正在寻找这些名称的初始来源,以机器可读的格式)。

我在寻找只是一个列表code point,并name在CSV或任何其他形式:

code   character name
...
0102   LATIN CAPITAL LETTER A WITH BREVE
0103   LATIN SMALL LETTER A WITH BREVE
...

回答

实际字符数据(包括字符名称和许多其他详细信息)的官方来源是Unicode 字符数据库。

最新版本的数据文件可以通过http://www.unicode.org/Public/UCD/latest/ 访问。

具体名称可以在文件中NamesList.txt找到。此处描述了该文件的格式。

这是 CSV 格式的列表:https : //www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt


以上是Unicode字符名称的官方存储库的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>