拦截指定数据、修改JS — mitmproxy

mitmproxy 配置

源码:https://github.com/mitmproxy/mitmproxy

mitmdump

  • -q:屏蔽mitmdump默认的控制台日志,只显示自己脚本中的
  • -s:入口脚本文件
  • -p:更改端口,默认为8080
  • 修改脚本文件时,不用重启也会生效

针对 HTTP 生命周期的事件

  • 请求:def request(self, flow: mitmproxy.http.HTTPFlow):
  • 响应:def response(self, flow: mitmproxy.http.HTTPFlow):
  • 其它:
    • def http_connect(self, flow: mitmproxy.http.HTTPFlow):
    • def requestheaders(self, flow: mitmproxy.http.HTTPFlow):
    • def responseheaders(self, flow: mitmproxy.http.HTTPFlow):
    • def error(self, flow: mitmproxy.http.HTTPFlow):

请求:def request(flow:flow)

  • flow.request.headers
    • 获取所有头信息,包含Host、User-Agent、Content-type等字段
  • flow.request.url
    • 完整的请求地址,包含域名及请求参数,但是不包含放在body里面的请求参数
  • flow.request.host
    • 域名
  • flow.request.method
    • 请求方式:POST、GET等
  • flow.request.scheme
    • 请求类型:http、https
  • flow.request.path
    • 请求的路径,URL除域名之外的内容
  • flow.request.get_text()
    • 请求中body的内容,有一些http会把请求参数放在body里面,可通过此方法获取,返回字典类型
  • flow.request.get_content()
    • 结果如flow.request.get_text(),返回bytes类型
  • flow.request.raw_content
    • 结果如flow.request.get_content(),返回bytes类型
  • flow.request.urlencoded_form
    • MultiDictView,content-type:application/x-www-form-urlencoded的请求参数,不包含url直接带的键值参数
  • flow.request.multipart_form
    • MultiDictView,content-type:multipart/form-data
  • flow.request.query
    • 返回MultiDictView类型的数据,URL的键值参数
    • flow.request.query.get(‘wd‘)
      • 取得请求参数wd的值
    • flow.request.query.keys()
      • 取得所有请求参数
    • flow.request.query.set_all(key,[value])
      • 修改请求参数
from mitmproxy.http import flowdef request(flow:flow): # 获取所有头信息,包含Host、User-Agent、Content-type等字段 # print(flow.request.headers) # 域名 # print(flow.request.host) # 请求方式:POST、GET等 # print(flow.request.method) # 请求类型:http、https # print(flow.request.scheme) # 请求的路径,URL除域名之外的内容 # print(flow.request.path) # 请求中body的内容,有一些http会把请求参数放在body里面,可通过此方法获取,返回字典类型 # print(flow.request.get_text()) # 返回MultiDictView类型的数据,URL的键值参数 # print(flow.request.query) # 完整的请求地址,包含域名及请求参数,但是不包含放在body里面的请求参数 if 'https://www.baidu.com' in flow.request.url: # 取得请求参数wd的值 # print(flow.request.query.get('wd')) # 取得所有请求参数 print(list(flow.request.query.keys())) # 修改请求参数 flow.request.query.set_all('wd',['python']) # 打印修改过后的参数 print(flow.request.query.get('wd'))

响应:def response(flow: flow)

  • flow.response.status_code
    • 状态码
  • flow.response.text
    • 返回内容,已解码
  • flow.response.content
    • 返回内容,Bytes类型
  • flow.response.get_text()
    • 取得响应的文本
  • flow.response.set_text()
    • 修改响应的文本
  • flow.response = flow.response.make(404)
    • 返回404
from mitmproxy.http import flowimport jsonimport redef response(flow: flow): # 状态码 # print(flow.response.status_code) # 返回内容,已解码 # print(flow.response.text) # 返回内容,Bytes类型 # print(flow.response.content) # 取得响应的文本 # print(flow.response.get_text()) # 修改响应的文本 # flow.response.set_text('123') # 返回404 # flow.response = flow.response.make(404) # 修改淘宝对selenium的js检测文件 targetUrl = 'https://g.alicdn.com/AWSC/uab/122.js' if targetUrl in flow.request.url: taobao_js =flow.response.get_text() taobao_js = taobao_js.replace('!function(){function','!function (){Object.defineProperties(navigator,{webdriver: {get: () => false}})function') flow.response.set_text(taobao_js) print('已修改') # 淘宝搜索商品时,自动打印商品信息 if 'https://s.taobao.com/search' in flow.request.url: start = flow.response.text.strip().index('{') end = -2 print(json.loads(flow.response.text.strip()[start: end])['mods']['itemlist']['data']['auctions']) # 空气质量网,修改检测F12的JS # https://www.aqistudy.cn/historydata if 'https://www.aqistudy.cn/historydata/monthdata.php' in flow.request.url: js = flow.response.text js = re.sub(r'endebug.*?}\);','',js,flags=re.S) flow.response.set_text(js) print('已正常')

相关文章