Python汉字转拼音,python汉字拼音,使用字典和转换程序,将汉


使用字典和转换程序,将汉字转换为拼音,配置好之后,可以转换为汉字拼音首字符和汉字全拼.这个使用一个字典和转化程序就行.网上有一个署名为caocao的人做了一个python的汉字转拼音的模块.

最原始的程序参考这篇文章:将GBK汉字转化为拼音的Python小程序 . 和这里,这个排版好些.文中用到的convert.txt就是字典,但是作者的博客中没有提供下载.我通过网络搜索,从其他途径下载到了整个压缩包,包括字典和 转换程序.该程序是基于GBK的, 要把汉字分成高低位来处理,一般人理解不了,我做了点改进就是把字典转化为utf-8的,因为在django中使用的代码就是utf-8的. 然后把他的程序也做了改进, 改成处理unicode字符,因为Unicode字符只需要处理一个字符,不用把字符分开成两半.代码中,convert1()函数是原来作者提供的,我 给它改了名字.我把我写的convert替换了原来的函数名, 并且把字典文件改成了utf-8编码的.所以要简单些.convert函数提供了

self.has_shengdiao = False self.just_shengmu = False self.spliter = '-'

用来配置参数, has_shengdiao,是汉字转拼音的时候带上拼音,just_shengmu ,是仅仅把汉字字串转为汉字首拼字母串, 为false的时候,转为全拼字符串.spliter是用来分隔汉字的.为空的时候,不把转换结果用spliter分开, 默认使用"-"(横线来连接汉字拼音PINYIN,因为W3C推荐在Url中使用-作为连字符,而不是下划线_来连接字符串,因为下划线作为链接连接字符 串的时候,url在地址栏中好像断掉了一样,_下划线经常看不到.)

字典文件,此处也提供不了,但是大家可以搜索下载原作的的字典, 然后使用支持utf-8转换的软件转换一下就行了.有需要的也可以和我联系.我的convert程序见下面。另外字典在这里

汉字转拼音

None

评论关闭