求Python筛选随机生成数的方法思路,python筛选,有一APP需求,要求生成


有一APP需求,要求生成全局唯一号码(类似QQ号),但是要把好的号码预先留下或者在用户注册的时候判断将要 获取的号码是不是好号码。。。

这个怎么做?

比如8位开始,像88888888,12345678,11111111,22222222,33333333,10000001都不能给用户……

随机生成,过滤已经生成过的和要留的就行了,贴段Java实现:

RandomStringUtils.randomNumeric(8)

使用了:commons-lang3

楼主的真正问题是:如何确定一个数是否“好数”,而不是已知一堆好数如何筛掉(那还不容易?)。

这个问题很普遍,我相信QQ和电信运营商都经历过相同的问题。简单地设定一些规则是可行的,但肯定不全,无可避免会漏掉一些。

最关键的,很多时候不但要区别哪些数漂亮,还得确定它的“漂亮程度”。

我能给出的解决方案是,开发个爬虫,获取该数字相关的域名、QQ号、手机号是否已被注册、注册时间是什么、价格是多少。例如www.12345678.com肯定超贵的对不对?

把数据爬下来后给定一个“指标”进行排序,所谓指标可以就是价格,排名靠前的数就是“好数”了。如果有兴趣研究下去,可以根据这个排名归纳出一系列规则,例如“位数”、“重复数字的个数”等等,然后将这些规则作为输入,“指标”作为输出,使用机械学习的方法计算每一个规则的权重,如果你能组织出足够强大的神经网络,还可以直接把整个数作为输入。

但这种问题肯定有人研究过的对不对?所以做这些工作之前——先找论文!

参考楼上各位回答,需要明确的是以下两个问题
1. 对于好号码的定义,就像AntonyBi所讲『什么样的号码才是好的号码』
2. 如何筛选(生成好号码)

对于问题一。我认为可以直接参考已有的规则(规则针对的是手机号的尾号),毕竟号码的好坏是人的感受。
另外规则不用定太多,链接中的有九条规则,保证了通常来讲最『顺』的号码另作分配,同时用户有可能获得规则外的相对『好』的号码,比如用户在申请时可以随机获得ABAC这样的号码。

对于问题二。
针对普通用户
第一步,随机生成号码。
第二步,判断生成的号码是不是『好』号码。
第三步,是好号码的话,回到第一步,不是到第四步
第四步,返回(返回后需要判断号码有没有被使用)

//假设低级用户可用ABC(123,234,345,...),高级用户可用ABCDE(12345,23456,...)
针对付费用户
第一步,看等级
第二步,根据等级(比如说低级),生成一个或多个随机数(比如说生成的是2,那么ABC就是234)
第三步(可选),看该数符不符合高级用户的规则,符合回到第二步,不符合到第四步
第四步,返回(返回后需要判断号码有没有被使用)

写了个demo判断生成的号码是不是好号码。其他语言的实现也会类似吧。

# required para:num,type list of intdef is_charm_num(num):    def is_AAAA(num):        return num[-4] == num[-3] \                and num[-4] == num[-2]\                and num[-4] == num[-1]    def is_ABCDE(num):        return num[-5] + 1 == num[-4] \                and num[-5] + 2 == num[-3] \                and num[-5] + 3 == num[-2] \                and num[-5] + 4 == num[-1]    def is_ABABAB(num):        return num[-6] == num[-4] \                and num[-6] == num[-2] \                and num[-5] == num[-3] \                and num[-5] == num[-1]    return is_AAAA(num) or is_ABABAB(num) or is_ABCDE(num)    if __name__ == '__main__':        num = 12345678        num_list = []        #num_list = map(int,str(num))        for n in str(num):            num_list.append(int(n))        is_charm_num(num_list)

可以正则表达式筛选。
比如(\d)\1{2,}表示找出同一个数字连续出现3次或以上的情况。(\d)(\d)\1\2表示ABAB的情况等。
当然正则还是有局限性的,比如没法方便的查找顺子等情况。这种情况需要通过生成器生成这类特殊数字拼入正则表达式。比如可以通过拼接生成如下表达式(123|234|345|456|567|678|789)来匹配三位递增的情况。

先写若干规则,
然后从0开始遍历,
符合规则的近白名单
不符合的不管

对你的问题比较感兴趣, 打算写个类库. 先留个坑, 等写完了会附上地址和使用方法. 所以我先说我的一下思路:

判断好坏是机器来判断, 所以如果是一个单纯的判断好/不好的bool值, 我想也没有多大意义, 因为这样做仅仅是一个过滤器, 无法判断好且好到什么程度, 我的想法有两点:

对于3来说, 还涉及的一个问题是单个数字, 如8 对应的权值应该会大那么一点点

本来看到这么多回复都不想写了,但是感觉回答都有点绕。。。

这个问题核心要分解成两个子问题:
1. 什么样的号码才是好的号码?
2. 怎么把这些好的号码可以实现单独分配?

对于问题一,这个想完全智能化是基本不可能的,需要用到人的知识,所以肯定是你例举所有好号码的规则,再去匹配满足这个规则的数字。比如说ABAB,ABBB,AABB,AAAA等,还有可能是包含8或6的数量等。
这种编写代码的时候,就统一对boolean isAwesomeNumber(String number)的接口做一堆实现,然后逐一匹配,就类似templete模式的方式即可。

对于问题二,要看你的业务逻辑,如果是卖手机号,那需要提前帅选出来进行分类,那就输入一个号码段,执行上述方法判断是否满足好号码的任意规则。输出的结果就实现了预期功能了。

其實就是「僞」隨機串,像 iPod 那樣自動過濾掉諸如「ABC」、「ABCABC」之類不「隨機」的隨機串。

只要寫一個判斷是否「不像隨機」用的方法,只要滿足就自動重新生成。

根據你的描述,「不像隨機」的串應該包括:

代碼如下:

function isPseudo(str) {    str = str + "";    return isDuplicate(str) || isSeries(str) || isIdealInteger(str) || isPalindromic(str);}function isDuplicate(str) {    var first = str[0];    for (var i = 1, n = str.length; i < n; ++i) {        if (str[i] !== first)            return false;    }    return true;}function isSeries(str) {    var series1 = 1 * str[0],        series2 = 1 * str[0];    for (var i = 1, n = str.length; i < n; ++i) {        var j = 1 * str[i];        if (j !== ++series1 && j !== --series2)            return false;    }    return true;}function isIdealInteger(str) {    for (var i = 1, n = str.length; i < n; ++i) {        if (str[i] !== "0")            return false;    }    return true;}function isPalindromic(str) {    for (var i = 0, n = str.length, n2 = n/2; i < n2; ++i) {        if (str[i] !== str[n - 1 - i])            return false;    }    return true;}

隨便找了幾個數試試,結果如下:

Object {8888: true, 10000: true, 100001: true, 1112111: true, 12345678: true, 342333423: false, 657865789: false}

用以上代碼,數字不像「隨機」(也就是漂亮)程度也差不多有了,再加上對單個數字的權重,加權計算就可以得到數字的「順」度。

编橙之家文章,

评论关闭