博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[python] pinyin 模块 -- 将汉字文本转化为拼音
阅读量:6379 次
发布时间:2019-06-23

本文共 1449 字,大约阅读时间需要 4 分钟。

hot3.png

许多情况下,我们需要将一段汉字转换为拼音。比如我们可以用拼音来进行排版,或者是将拼音输出到其他程序,生成语音。

一般将汉字转化成拼音这样的功能,我们需要一个字典来实现。比如 Mandarin.dat 。不过在 PyPI 中,已经有不少模块将其封装,而这里要介绍的就是 pinyin 模块。

1. pinyin 模块的安装

我们可以使用 pip 或 conda 指令安装 pinyin 模块。

$ pip install pinyin

$ conda install pinyin

2. 进行简单的拼音转换

在 pinyin 模块中,我们只需要一个简单的 get() 函数,就可以返回拼音的符号

>>> import pinyin>>> pinyin.get('你好')'nǐhǎo'

如果使用 delimiter 参数的话,可以设置两个拼音之间的分隔符。比如可以设置为空格:

>>> pinyin.get('你好', delimiter=" ")'nǐ hǎo'

很多时候, ǐǎ 这样的符号并不适合计算机来读取。 format 参数可以设置输出拼音的方式,比如我们设置为 strip 参数去掉注音,或者使用 numerical 将注音以数字的方式放在最后:

>>> pinyin.get('你好', format='strip', delimiter=" ")'ni hao'
>>> pinyin.get('你好', format='numerical', delimiter=" ")'ni3 hao3'

3. 获得每个拼音的首字母

使用 get_initial 就可以输出每个文字拼音的首字母。不过它会自动加空格。

>>> pinyin.get_initial('你好')'n h'

4. 甚至还有中译英功能

从项目 Github 的介绍来看, pinyin 这个模块甚至还有中文翻译功能。不过作者也说这个功能是测试用的,而且也很久没有更新的。所以只把官方的介绍放一下:

>>> import pinyin.cedict>>> pinyin.cedict.translate_word('你')['you (informal, as opposed to courteous 您[nin2])']>>> pinyin.cedict.translate_word('你好')['Hello!', 'Hi!', 'How are you?']>>> list(pinyin.cedict.all_phrase_translations('你好'))[['你', ['you (informal, as opposed to courteous 您[nin2])']], ['你好', ['Hello!', 'Hi!', 'How are you?']], ['好', ['to be fond of', 'to have a tendency to', 'to be prone to']]]

这个功能只是一个试验功能,所以只是放着玩一玩的,如果大家要更精确的汉译英,可以查找 python 如何使用在线翻译。

5. 结语与其他文档

pinyin 模块就这样介绍完了。虽然比较简单,但也十分使用。很多时候,文本转拼音还是一件比较简单的事,但是要将拼音转化为文本就可以使用另外一个模块的功能:

转载于:https://my.oschina.net/u/3729927/blog/2123816

你可能感兴趣的文章
DedeCMS操作基础(一)
查看>>
FreeBSD部署dns缓存服务器
查看>>
实现MySQL允许远程连接
查看>>
Java Outputstream to String
查看>>
RS232C串口通信接线方法(三线制)
查看>>
Android 自定义View属性相关细节
查看>>
type already defined error in Eclipse
查看>>
OSA 安装
查看>>
先安装.Framework然后再安装IIS,ASP.NET程序不能运行
查看>>
NPOI Excel下拉项生成设置
查看>>
360该不该拍?
查看>>
用Xib创建控制器
查看>>
oracle的sqlplus和dos的中文乱码问题
查看>>
LVS+keepalived高可用负载均衡集群部署(二)---LAMP网站服务器与LVS服务器
查看>>
Struts2之简单数据类型转换
查看>>
python 打印数字
查看>>
iptables规则的查看、添加、删除和修改
查看>>
打开网站显示输入用户名和密码
查看>>
size_t的32位和64位兼容
查看>>
HBase全分布式模式的安装和配置
查看>>