猜想Google的“IP隐藏”

曾经有篇文章说过,Google spider很会“隐藏”IP地址,不管是从哪里来的spider(例如来自香港的spider、俄罗斯的spider),从被爬的站点看来,那些IP都是来自加利福尼亚。Google是如何做到的呢?个人做个简单的分析。

我们知道Google拥有大量的申请到的IP地址、有自己的数据中心,那么Google为了连接分布于各地的分支机构,而又为了让外界看起来自己的所有IP都是位于加利福利亚,可以用几个很简单但有效的办法。我猜测,Google的做法会是这样:

  • 全部的分支机构都是用Google自己申请到的IP地址,而不是从当地运营商再申请一批新的地址;
  • Google拥有自己的Autonomous system (AS) Number,这样就可以既为Google自身网络的连接提供独立的路由,而又可以根据分支机构的不同位置采用不同的路由来连接当地网络。

仅仅使用这两种做法,就可以让外界以为Google隐藏了IP地址。

不过,这仅仅是个人猜测,也许与真实情况有出入。