python如何处理中英文混排最长公共前缀问题,,比如:str1 = "我


比如:
str1 = "我是a good boy" str2 = "我是a bad boy"

两者的公共前缀为:我是a

引自 os.path.commonprefix,参数可以是任意数量的list

def commonprefix(m):    if not m: return ''    s1 = min(m)    s2 = max(m)    for i, c in enumerate(s1):        if c != s2[i]:            return s1[:i]    return s1commonprefix(['我是a good boy', '我是a bad boy'])

如果只需要两个字符串,可以简化为

def commonprefix(s1, s2):    for i, c in enumerate(s1):        if c != s2[i]:            return s1[:i]    return s1

os.path.commonprefix((str1, str2))

其实我想说,如果楼主强调的是“中英文混排”这件事的话,那么如果两个字符串的同为unicode,或者采用了相同的字节编码方式的话,应该中英文混排这件事其实是没有区别的。

采用unicode时,每个汉字或者每个英文都是一个完整的字符;采用比如utf-8编码时,每个汉字是3个字节,每个英文是一个字节,那么依然不影响前缀的比较

转化為list

def longestprefix(str1, str2):    if str1 == str2:        return str1    return '' if str1[0] != str2[0] else str1[0] + longestprefix(str1[1:], str2[1:])

Python 3.4 测试可以, 2.x 没尝试

编橙之家文章,

评论关闭