求实现Python脚本判断中文字符是否为同一姓名思路方法,,冷狐毕军,高李阳子,闻人
求实现Python脚本判断中文字符是否为同一姓名思路方法,,冷狐毕军,高李阳子,闻人
冷狐毕军,
高李阳子,
闻人共建,
欧阳新成,
徐姜敏然,
某家公司,
欧阳伟强,
石戴菲子,
朱为准,
徐海峰,
王潇荔,
种亚男,
付义平,
鲁雅萍,
... ...
如上面的例子,怎么用脚本判断他们是一个名字,不是的自动删除所在行!
不限定语言!
我的想法是,把百家姓写入一个文件中,取要识别的中文字符串的第一个字,去匹配百家姓每个姓的第一个字,如果有匹配的,第二步,反过来取这个姓的完整中文字符串,假设这个姓中文字符长度为n,拿去匹配那个要识别的中文串的前n个字符,如果也匹配,默认它就是一个中文姓名!
难实现吗?
姓好处理,关键是名如何判断,逻辑比较麻烦,但实现很简单吧。。。。
另外,姓不仅仅只有一个字的,还有复姓。。
你需要 Named Entity Recognizer (NER)
比如:http://nlp.stanford.edu/software/CRF-NER.shtml 虽然上面写有 "Chinese models built from the Ontonotes Chinese named entity data" 但是不确认效果
无法判断。
我可以给我儿子取名叫做
「怎么用」、「脚本判」、「断几个」、「连续的」、「续的中」、「中文字」…… 完全符合中国法律。
编橙之家文章,
相关内容
- Python SQLAlchemy定义触发器、存储过程是怎样实现的,p
- 没有编程基础能学好python语言吗,编程基础python,没有任
- flask调试不开httpserver提供静态文件应该怎么操作,fla
- 请问一个窗口内可以运行python多个线程吗?,一个窗口
- Python方法将前端获取二进制上传到upyun方法,求大神赐教
- Python attrs作用是什么?,pythonattrs作用是,from rest_fr
- python http请求用ihttplib\httplib2\urllib2谁速度最快,ihttpl
- 反向代理用Python怎么写?,反向代理Python,用python写一个
- 想用Python批量命名文件如何实现?,python命名实现,工作
- python和php消耗资源谁更多,web负载能力检测,pythonweb,用
评论关闭