数据跟踪:翻滚吧!Web流量工具

日期:2015-12-16作者:Brad Irby

【TechTarget中国原创】随着对在线隐私的不断关注,知道数据发给谁、由哪个程序发出去就显得尤为重要。在此,我来给大家看看免费的Web跟踪工具是如何方便地获得此类信息的。
在我们这里永远连接的世界里,忘记我们机器上一直发出的不可见的Web请求是很容易的。在我不科学的测试里,我只让自己的机器空闲了1分钟,然后我的Web流量工具就记录了超过100条来自Facebook、Pinterest、Google Docs和微软OneDrive的Web请求。这还只是在你不知情的情况下在Web上不断收发数据的部分来源而已。
这里有一些可以下载的流量分析工具。Wireshark这个名字已经有很长的一段历史,是个牢固的跨平台工具。然而,由于我是Windows开发者,并且是Telerik工具的粉丝,所以优先推荐的是免费工具Fiddler。这个工具提供了HTTPS流量分析、性能测试以及通过扩展增加定制功能的手段。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者>更多

Brad Irby
Brad Irby

Brad Irby has been a developer and systems architect since 1990, designing and implementing systems using the Microsoft stack.

技术手册>更多

  • 智能BPM与业务流程工具

    Gartner认为iBPM要比运营型智能平台更优秀,表现在以下几个方面:iBPM套件提供更好的工作流,适配性案例管理以及结构化流程协调能力。

  • 云BPM新常态解析

    云端业务流程管理已经不再是什么新鲜事,更不再是什么可怕的方法来管理重要的业务流程。现在,它已经普遍被认为是一种新常态。组织已经从这一技术中获益,使它来更有效地访问和管理企业信息。

  • 企业IT集成指南

    随着云技术的不断采用,现代企业都面临着重大的集成问题。现在已经不再是把企业内部的数据和应用简单地缝合在一起,企业IT现在面临着整合着外部与内部信息的难题。

  • API开发与管理大作战

    2014将会是API管理方法新旧PK的一年,据Delyn Simons说,她领导了Mashery开发者的外展团队。应用编程接口(API)的主流化和私有化在新的一年也将掀起波澜,她在波士顿“Future Insights Ultimate Developer Event 2013”大会上预测说。

【TechTarget中国原创】

随着对在线隐私的不断关注,知道数据发给谁、由哪个程序发出去就显得尤为重要。在此,我来给大家看看免费的Web跟踪工具是如何方便地获得此类信息的。

在我们这里永远连接的世界里,忘记我们机器上一直发出的不可见的Web请求是很容易的。在我不科学的测试里,我只让自己的机器空闲了1分钟,然后我的Web流量工具就记录了超过100条来自Facebook、Pinterest、Google Docs和微软OneDrive的Web请求。这还只是在你不知情的情况下在Web上不断收发数据的部分来源而已。

这里有一些可以下载的流量分析工具。Wireshark这个名字已经有很长的一段历史,是个牢固的跨平台工具。然而,由于我是Windows开发者,并且是Telerik工具的粉丝,所以优先推荐的是免费工具Fiddler。这个工具提供了HTTPS流量分析、性能测试以及通过扩展增加定制功能的手段。

你可以下载和安装该Web流量工具Fiddler(注意如果不喜欢的话你不必提供电子邮件地址)。一旦安装后,运行Fiddler你就会看到界面显示你的机器发往Web的每一个请求。甚至你什么都没做,你也会惊讶地发现一台典型机器发出了多少的流量。

对于开发者来说,Fiddler是Web调试的一种手段,但它也为非开发者提供了大量信息。有了这一Web流量工具,一般的用户不用挖掘很深也能看到随数据发送的每一个请求以及来自远程服务器的响应。

要想看这些数据,只需要扫描下面这些默认列。

结果

结果列是请求是否成功的代码。最常见的代码包括:

协议

协议可以用HTTP或HTTPS。HTTPS意味着使用了SSL,因此你的流量发送前是经过加密的。当然,这并不意味着HTTP就是不加密的流量(参见下面“主机”、“隧道”的讨论)

主机

主机(Host)要么是访问的URL根地址,要么是“隧道(Tunnel To)”。你也许注意到你大部分的敏感流量是通过这些隧道传输的,比如微软OneDrive、Google数据请求等。看起来这些流量似乎未经加密,因为列出来的协议是HTTP,不过请不要担心。“Tunnel To”意味着连接请求已经发出,这表明后续会有持续的流量发往目的网站。初始请求是通过SSL建立的,并且建立了一个到目的地的专门隧道。一旦隧道建立,所有的流量都是通过这条隧道传输,并且在离开你机器前就已经加密好了。

URL

指被请求的特定页面或者端点(或根URL,如果使用了隧道的话)。许多后端服务会使用看起来不熟悉的URL。比方说,docs.live.net:443实际上是微软OneDrive。

检查进程(Process)列看看是哪些应用发出给定的请求。如果你看到Explorer这个进程,那它指的是Windows Explorer(不是IE)。Windows Explorer基本上就是Windows它自己,其流量往往是Windows刷新live title的数据引起的。

缓存

网站可以在Web页面头部指定客户端缓存管理。它表明该页面是否在客户端进行缓存(而不是服务器端)。如果缓存列为空,则客户单允许缓存该页面以改进你下次浏览的显示速度。

样例数据

下面看看从我的机器抽取的一段样本数据(图1),你可以说出来好些我在做的事情了。

数据跟踪:翻滚吧!Web流量工具

图1:这里你可以找到可能产生Web流量的所有程序的视图

图1的屏幕顶部你可以看到docs.live.net:443。这是微软Word到微软OneDrive的连接,我正在用来撰写本文。Vortex.dat.microsoft.com这个条目是发送给微软用于客户体验改进计划的诊断性信息。其他的条目,你可以看到右侧Porcess列显示的是调用的方法。

Explorer的四项不是来自IE—而是来自Windows Explorer,你机器上的本地文件浏览器,它是跟Windows紧密集成的。Windows会进行一些查询来保持活动瓷片的更新(我的Windows 8安装版本是这样的)。

高亮显示表格的任意行可以看到特定请求的细节。那你可以浏览很多东西,但最有趣的是泡沫右侧的Inspectors标签。选择Inspectors,然后点击底部的WebView标签,你会看到被发送和接收信息的细节。比方说,图2显示了Sports Live Tile更新的细节。

图2:该视图允许你近距离观察共享的数据

通过Fiddler,你可以浏览本地机器产生的所有Web流量,也可以看到那些程序会送什么样的数据给母舰。