python爬虫所遇问题列举,,1、通过python


1、通过python socket库来构造请求报文,向服务器发送图片请求时

  (1)图片在浏览器请求头中的remote address信息跟通过python socket输出远程连接地址和端口号不一致

    Remote Address:183.61.138.62:443

    raddr=(‘183.61.138.62‘, 80)

    80表示http协议默认端口,443表示https协议默认端口

    技术图片

技术图片

  2、在浏览器中输入图片地址,然后调试Network窗口发现,响应体不是直接返回image文件,而是文档文件

技术图片

  3、及时正确返回包含图片二进制码的响应报文时,为了获得Content-Length(图片的大小),必须将响应行和响应头解码,但是解码在对图片二进制码进行解码时,

会报错:

    UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xff in position 516: invalid start byte

    如何解决?

python爬虫所遇问题列举

评论关闭