首页 > 其他 > 详细

汉字转拼音-pypinyin模块

时间:2021-04-15 09:30:03      阅读:29      评论:0      收藏:0      [点我收藏+]

最近遇到一个问题,需要将一批中文用户名转换成拼音,网上查了一下,有两个模块可以使用,pypinyin和xpinyin模块,用起来也很方便。

一、pypinyin模块

1、安装

pip3 install pypinyin

2、转换

from pypinyin import pinyin
print(pinyin(张三))
[[zhāng], [sān]]

可以看到结果是一个二维列表,每个元素都是一个列表,并且包含了每个字的读音。

如果是多音字,比如 “朝阳”,默认只能识别其中一个读音
from pypinyin import pinyin
print(pinyin(朝阳))
[[zhāo], [yáng]]

如果想要显示多个读音的话,只需添加 heteronym参数并设置为True:
from pypinyin import pinyin
print(pinyin(朝阳, heteronym=True))
[[zhāo, cháo], [yáng]]

 

3、其实多数情况下我们是不需要管多音字的,我们只是用它来转换一下名字而已,而处理上面的二维数组又比较麻烦,那么可以使用lazy_pinyin这个方法来生成

from pypinyin import lazy_pinyin

name_list = [
    张三,
    李四,
    小六子
]

for name_zh in name_list:
    # 将每个中文汉字转换成拼音,组成列表
    name_pinyin_list = lazy_pinyin(name_zh)
    # print(name_pinyin_list)
    ‘‘‘
    [‘zhang‘, ‘san‘]
    [‘li‘, ‘si‘]
    [‘xiao‘, ‘liu‘, ‘zi‘]
    ‘‘‘
    name_pinyin = ‘‘
    # 将拼音拼接到一起
    for i in name_pinyin_list:
        name_pinyin += i

    print(name_pinyin)
    ‘‘‘
    zhangsan
    lisi
    xiaoliuzi
    ‘‘‘

 二、xpinyin模块

from xpinyin import Pinyin

p = Pinyin()  # 实例拼音转换对象
re1 = p.get_pinyin(小姐姐真可爱,tone_marks=None,splitter= ) #转换,不显示声调,使用空格作为分隔符。
#其中tone_marks指定是否带声调,默认为None;splitter指定分隔符,默认为‘-‘。

re2 = p.get_pinyin(小姐姐真可爱,tone_marks=marks,splitter= ) #转换,显示声调。
re3 = p.get_pinyin(小姐姐真可爱,tone_marks=numbers,splitter= ) #转换,显示声调数字。

p.get_initials("小姐姐真可爱",splitter= ) #获取首字母
print(re1,re2,re3)  #打印

 

汉字转拼音-pypinyin模块

原文:https://www.cnblogs.com/dxnui119/p/14660751.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!