UrkoM Asked: 2010-09-14 19:49:09 +0800 CST2010-09-14 19:49:09 +0800 CST 2010-09-14 19:49:09 +0800 CST 自动保存特定 URL 的代理 772 我正在寻找可以执行以下操作的网络代理: 如果请求的 URL 与特定模式匹配(正则表达式是理想的),则将传输保存到指定文件夹。 我不确定是否可以使用 Squid(我已经在运行)实现这一目标,但我愿意使用其他工具。 谢谢! automation proxy 1 个回答 Voted Best Answer Riccardo Murri 2010-09-15T00:17:54+08:002010-09-15T00:17:54+08:00 实现此目的的一个技巧是使用 wwwoffle:当处于“在线”模式时,wwwoffle 将所有访问过的页面(不包括与指定正则表达式匹配的页面)保存到一个文件夹中。您可以配置缓存文件夹路径。 据我所知,没有直接的方法可以告诉 WWWOFFLE 要保存哪些页面/URL,但可能有解决方法: 如果你可以否定你的正则表达式,你可以告诉 WWWOFFLE 哪些页面 不保存 如果您的浏览器支持 proxy.pac基于 JavaScript 的代理配置,则可以简单地编写一个 JavaScript 函数来指示浏览器仅对匹配正则表达式的 URL 使用代理。 当 URL 匹配特定模式时,您可能能够配置 Squid 以使用 WWWOFFLE 作为父代理;即,当请求 URL 与正则表达式匹配时,您有 browser->Squid->WWWOFFLE->Internet,否则有 browser->Squid->Internet。
实现此目的的一个技巧是使用 wwwoffle:当处于“在线”模式时,wwwoffle 将所有访问过的页面(不包括与指定正则表达式匹配的页面)保存到一个文件夹中。您可以配置缓存文件夹路径。
据我所知,没有直接的方法可以告诉 WWWOFFLE 要保存哪些页面/URL,但可能有解决方法:
如果你可以否定你的正则表达式,你可以告诉 WWWOFFLE 哪些页面 不保存
如果您的浏览器支持 proxy.pac基于 JavaScript 的代理配置,则可以简单地编写一个 JavaScript 函数来指示浏览器仅对匹配正则表达式的 URL 使用代理。
当 URL 匹配特定模式时,您可能能够配置 Squid 以使用 WWWOFFLE 作为父代理;即,当请求 URL 与正则表达式匹配时,您有 browser->Squid->WWWOFFLE->Internet,否则有 browser->Squid->Internet。