Python列表边遍历边删除,怎么用才不报越界错误呢?,


背景

今天双十一,昨晚有好多电商行业的 IT 工程师们挑灯夜战,为这个全民狂欢的购物节护航。还记得三年前我们公司一个产品上线前一周时,办公室内拉起“跟 Bug 死扛到底”的横幅,Bug 可以说是程序员的死穴。我每次预感到代码有 Bug 时,神色立马紧张起来。

编程路上,Bug 载道;前车之鉴,后车之师。本文整理了一些我在问答技术网站上看到的、回答过的有价值的问题。权当是个人知识库了!

IDEA 编辑的功能

IDEA 强大的自动代码补全功能快捷键 Tab,代码标签输入完成后,按Tab,生成代码。

  • div.class.out + Tab
  • 常用的有 fori/sout/psvm+Tab 即可生成循环
  • System.out、main 方法等 boilerplate 样板代码,要输入 for(User user : users) 只需输入user.for+Tab
  • 输入 for(User user : users) 只需输入user.for+Tab
  • 要输入Date birthday = user.getBirthday(); 只需输入user.getBirthday().var+Tab 即可。

Python 中查看某个模块的用法

Python 命令行输入后,可以使用 help 方法查看方法的用法,例如:

  1. import re 
  2. help(re.compile) 

在控制台输出得到该方法的描述信息:

Python列表边遍历边删除,怎么用才不报越界错误呢?

Python 不忽略首行

Python 处理 csv 文件时,pandas.read_csv(“data.csv”) 默认会将第一行作为标题行信息,不做处理。怎么让它从第一行开始处理呢?header=None 可以达到该目的。

  1. df =  pd.read_csv("data.csv", header=None) 

对象晋升到老年代的过程

对象优先在Eden分配,且新生代对象晋升到老年代有多种情况

  • Eden 区满时,进行 Minor GC,当 Eden 和一个 Survivor 区中依然存活的对象无法放入到 Survivor 中,则通过分配担保机制提前转移到老年代中。
  • 若对象体积太大, 新生代无法容纳这个对象,-XX:PretenureSizeThreshold 即对象的大小大于此值, 就会绕过新生代, 直接在老年代分配, 此参数只对 Serial 及 ParNew 两款收集器有效。
  • 存活期限长的对象直接进入老年代。

Python 边遍历边删除

边遍历边删除数组会导致数组索引范围变化,导致程序出错,这在 Java 中也是需要注意的问题。但是,Python 的数据处理方法提供了一个巧妙的处理方法。

Python列表边遍历边删除,怎么用才不报越界错误呢?

使用 sorted(list) ,会产生一个新的数组,所以据此删除原来数组的元素,不会改变下标,不会出错。即遍历过程中是用 sorted(list) 返回的新数组,而删除是操作原来的数组,即遍历用了一份拷贝,修改完原数据后得到最终需要的结果了。

__name__的含义

经常看到 Python 会看到 if __name__ == '__main__':这样的代码,这段代码是什么作用呢,去掉这段代码后,为什么程序不会执行呢?

__name__ 是系统内置变量,代表所在模块名字,也即所在文件名。当模块直接运行时,如 demo_list.py 文件被直接运行,__name__ 的值为 “__main__”,所以 if __name__ == '__main__': 通常是触发主流程的。

推导式的过程

推导式的过程:是将整个最后的结果再存入容器的,而不是一边遍历一边推导的。

会在推导式执行完成后,一次性将结果写入 tmp_list 变量,而不是执行推导式的过程中就直接写入 tmp_list 变量。

  1. tmp_list = [i for i in num_list if i not in tmp_list] 

这是无效的,tmp_list 并不是预期推导的值。

解析 ngix 日志按小时统计行数

给定一个 ngix 日志文件,解析时间列并按时间统计每小时的日志行数。日志文件格式为:

  1. 192.168.1.1 [22/Oct/2019:23:58:54 +0800] "POST /dasdhj/sadqwda/q.log  
  2. HTTP/1.1" 200 133 0.022 "-" "Apache-HttpClient/4.3.3 (java 1.5)" "-" 

编写 Shell 解析命令为:

  1. awk '{ print $2}' ngix.log  | awk -F ":" '{a[$2]=a[$2]+1} END {for(i in a) { print "time:",i,"count:",a[i]}}' 

思路:

  • 先进对日志按空格分割,得到第二列的日志记录时间戳列
  • 再对时间列按冒号分割,得到时间列,并按时间列累加
  • 输出时间和累加值

input 表单不触发 onclick 事件

一个简单的触发隐藏一个 h1 标签的事件,但是没有执行,代码为:

  1. <h1 id="EleId">请点击此文本!</h1> 
  2. <input type="button" value="点击隐藏" οnClick="alert('111');">  

反复测试,最终确认是 input 的用法错误了,使用 button 按钮元素就可以了:

  1. <button id="clear-button" onclick="clearInput();">点击隐藏</button> 

线程池关闭导致 AtomicInteger 计数不准确问题

AtomicInteger 类是使用 CAS 原则来实现对数值类型的原子操作的,而且并发效率比 synchronized 高很多。今天看到一个因为线程池提前关闭,导致任务中对 AtomicInteger 计数操作未执行,进而打印的计数值不准确的问题。

这个问题侧面验证了原子类的高效,此外,还有一个知识点是关于 ConcurrentLinkedQueue 类的,判断队列是否还有元素,应该使用 isEmpty() ,而非 size()。因为是链表,size 操作需要遍历列表统计元素总数;而 isEmpty() 直接判断 first 是否为 null ,效率比前者高。

ajax 请求 415 问题

SSM 项目中出现 ajax 415,出现了请求类型为 json 时后台 415 的问题,这个主要是提交请求时的文件类型和 SpringMVC 配置的类型不一致导致的:

  • type:json
  • 后台要指定 medias 包含 json 类型

评论关闭