Fiddler 网页采集抓包利器__手机app抓包

jxhd1 2021-11-14 原文

用curl技术开发了一个微信文章聚合类产品，把抓取到的数据转换成json格式，并在android端调用json数据接口加以显示；

基于weiphp做了一个掌上头条插件，也是用的网页采集技术；和一个创业团队一起在做一个高考志愿填报系统，所有的数据也是从别的地方抓取。

总而言之，网页抓取与网页采集技术是一项非常实用的技能，他能让我们高效快速的获取我们开发产品所需要的一些基本数据。

网页抓取与网页采集过程中难免需要用到抓包技术，所谓抓包，就是我们在访问一个目标网站的时候，需要分析我们提交给浏览器的一些http请求以及提交给浏览器的一些数据，在知道请求是如何发起的以及post了哪些数据之后，我们才能针对目标网页写出相应的采集程序。特别是在模拟登陆一些需要用户进行登陆验证的网站时，抓包分析就变得很重要。

一些浏览器自带抓包分析工具或者有其可扩展的抓包插件，像火狐浏览器有firebug插件，IE浏览器有HttpWatch。每个抓包工具都有其独特的功能，这里就不一一介绍了，今天给大家介绍一个好用的抓包工具Fiddler。

手机APP抓包

现在我们来结合一个具体的例子来讲一下如何抓包分析手机APP的请求数据，并达到自己的需求。我这里给大家讲一个LOL盒子的抓包实例。

我们知道，LOL盒子没有网页版，或者说网页版的功能并不像手机APP一样数据整合的那么齐全。如果我们要做一个微信版的LOL盒子，让用户在微信端回复一些关键词就能查看一些基本信息，比如用户在微信中回复“英雄”就能查看LOL全部的英雄信息，包括出装、符文之类的。那么我们想在微信端实现这些功能，肯定需要数据库的支持，如果我们的数据从LOL官网抓取的话，免不了要写很多匹配规则，所以一个简单高效的方法是直接抓取LOL盒子已经整合了的数据。那么正题开始，我们开始抓LOL盒子集成的全部英雄的数据。

1、首先在手机下载LOL盒子，并进入首页（请忽略我这个战五渣的战斗力指数）

2、打开Fiddler并点Remove all把抓包信息全部清除

3、在LOL盒子中点击英雄进入查看英雄页面

4、可以看到查看英雄页面有免费、我的英雄、全部三个选项

5、这时候我们可以看到Fiddler已经抓到我们需要的数据接口了

6、我们在其中一个数据接口上面点击右键，复制url地址并在浏览器中打开

7、就能看到我们需要的周免英雄的数据接口了，是json格式的

到此为止，抓包分析的整个流程大家一目了然了，得到了json接口之后，我们就能用curl技术把数据采集下来，并把json格式的数据转换成数组或者其他格式，然后就可以存到我们自己的数据库中了，当用户在微信中回复关键词时，我们就从数据库中取出相应的数据并回复给用户就行了。

版权声明：本文为jxhd1原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/jxhd1/p/7762427.html

Fiddler 网页采集抓包利器__手机app抓包的更多相关文章

mac mono Fiddler.exe启动失败
mono version 5.4 fiddler version 4.6 启动fiddler：mono Fid […]...
推荐一个免费的HTTP抓包分析工具 Fiddler Web Debugger
推荐一个免费的HTTP抓包分析工具 Fiddler Web Debugger HTTP抓包工具有很多，比如 H […]...
fiddler 教程，fiddler 手机抓包教程，Fiddler使用方法大总结
Fiddler基础知识 Fiddler是强大的抓包工具，它的原理是以web代理服务器的形式进行工作的，使用的代 […]...
Fiddler 抓包学习_下载安装配置
本文为学习Fiddler 抓包的一点记录，如有不妥之处请各位大神指点，谢谢！什么是抓包抓包（packe […]...
抓包工具Fiddler的使用
Fiddler是最强大最好用的Web调试工具之一，它能记录所有客户端和服务器的http和https请求 […]...
Fiddler是最强大最好用的Web调试工具之一–网站抓包分析
Fiddler是最强大最好用的Web调试工具之一，它能记录所有客户端和服务器的http和https请求，允许你 […]...
Fiddler 高级用法：Fiddler Script 与 HTTP 断点调试
转载自 https://my.oschina.net/leejun2005/blog/399108 1、Fid […]...
Fiddler 4 断点调试（修改request请求参数）
1.选中要测试的链接 2然后点击规则的Automatic Breakpoints 的Before Req […]...

随机推荐

远程桌面用户账户限制！！
这是因为服务器本地策略规定了不允许空密码远程访问。关掉就好了 ...
SQL Server 2008 R2安装图解教程
一、下载SQL Server 2008 R2安装文件 ed2k://|file|cn_sql_server_2 […]...
关于请求接口报4XX错误，给广大前端同胞进行伸冤澄清，请相信它不一定都是前端的错
关于请求接口报4XX错误，给广大前端同胞进行伸冤澄清，请相信它不一定都是前端的错首先确保接口没有写错，参数按 […]...
公司里为什么要设置健身房？
最近在招聘网站上发现有一些公司是为员工提供健身房的，这难道仅仅是公司给员工的福利吗？了解之后才发现，原来公司给 […]...
嵌入式整体框架——总结 – Darren715
嵌入式整体框架——总结嵌入式应该什么都要涉及的到，从最开始的51单片机，之后到高级一些的微控 […]...
ACNet：用于图像超分的非对称卷积网络
编辑：Happy 首发：AIWalker Paper:https://arxiv.org/abs/2103.1 […]...
tomcat各目录作用
1.bin bin目录主要是用来存放tomcat的命令，主要有两大类，一类是以.sh结尾的（linux命令）， […]...
oracle使用索引和不使用索引性能分析
首先准备一张百万条数据的表，这样分析数据差距更形象！下面用分页表数据对表进行分析，根据EMP_ID 字段排序 […]...

展开目录

目录导航