多久使用一次代理来混淆互联网流量?大多数公司是否直接连接到 Internet(在使用代理缓存和过滤内容之后),或者是否对他们的流量进行了一些混淆,这是允许的吗?
我很想知道是否有更好的方法来跟踪来自特定客户端的页面视图,即使他们的 IP 地址在不使用 cookie 的情况下发生了变化。最好的猜测是使用他们的 http 标头(用户代理、语言环境),但这并没有提供那么多信息。
这里有几个问题。
- 代理多久使用一次来混淆流量?
- 公司会这样做吗?
- 如何在不依赖 cookie/远程地址的情况下最好地识别唯一访问者。
我不确定您所说的“混淆流量”是什么意思,但大多数规模合理的公司至少会使用某种形式的NAT,以便所有客户端在外界看来就好像它们具有相同的 IP 地址。目标不是专门的流量混淆,而是将内部 IP 地址与公共 IP 地址隔离(出于安全目的),并减轻可用公共 IP 地址的压力。
大多数大公司代理所有互联网流量,但这并不是试图混淆。大多数公司代理的目标是过滤和缓存。
要回答您的问题:
几乎从不以混淆为目的,通常过滤和保护 IP 是原因。
公司通常为其出站互联网流量提供代理。
可能是堆栈溢出问题,用于使用代码来唯一标识。对于匿名用户来说,这将是一项艰巨的任务。
代理在大公司中很常见。如果不出意外,缓存收益可能是巨大的。
如果您希望页面对用户(而不是 IP 等)是唯一的,请在客户端使用某些东西来跟踪它们。有两种常见的方法可以做到这一点: