一个将汉字转换成汉语拼音的python库的代码
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了一个将汉字转换成汉语拼音的python库的代码,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1359字,纯文字阅读大概需要2分钟。
内容图文
![一个将汉字转换成汉语拼音的python库的代码](/upload/InfoBanner/zyjiaocheng/1113/71191bccfa8948659cd510b24b8d2a8d.jpg)
下边代码段是关于一个将汉字转换成汉语拼音的python库的代码。
#!/usr/bin/env python
"""
Author:cleverdeng
E-mail:clverdeng@gmail.com
"""
__version__ = ‘0.9‘
__all__ = ["PinYin"]
import os.path
class PinYin(object):
def __init__(self, dict_file=‘word.data‘):
self.word_dict = {}
self.dict_file = dict_file
def load_word(self):
if not os.path.exists(self.dict_file):
raise IOError("NotFoundFile")
with file(self.dict_file) as f_obj:
for f_line in f_obj.readlines():
try:
line = f_line.split(‘ ‘)
self.word_dict[line[0]] = line[1]
except:
line = f_line.split(‘ ‘)
self.word_dict[line[0]] = line[1]
def hanzi2pinyin(self, string=""):
result = []
if not isinstance(string, unicode):
string = string.decode("utf-8")
for char in string:
key = ‘%X‘ % ord(char)
result.append(self.word_dict.get(key, char).split()[0][:-1].lower())
return result
def hanzi2pinyin_split(self, string="", split=""):
result = self.hanzi2pinyin(string=string)
if split == "":
return result
else:
return split.join(result)
if __name__ == "__main__":
test = PinYin()
test.load_word()
string = "钓鱼岛是中国的"
print "in: %s" % string
print "out: %s" % str(test.hanzi2pinyin(string=string))
print "out: %s" % test.hanzi2pinyin_split(string=string, split="-")
<h4>附件:<a href="/uploadfiles/2013/06/20/13717130117510.zip">源代码下载</a></h4>
原文:https://www.cnblogs.com/fulhns/p/11241287.html
内容总结
以上是互联网集市为您收集整理的一个将汉字转换成汉语拼音的python库的代码全部内容,希望文章能够帮你解决一个将汉字转换成汉语拼音的python库的代码所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。