如何仅在图像较新时才从HTTP下载图像

本文关键字:图像 HTTP 下载 何仅 新时 | 更新日期: 2024-11-06 22:23:52

我想实现以下功能:

  1. C# 客户端连接到 HTTP 服务器并将映像下载到磁盘。

  2. 下次客户端启动时,请检查服务器上的映像是否比磁盘上的映像新,在这种情况下,客户端将覆盖磁盘上的映像。

对我来说,下载图像很容易,但我不确定如何检查服务器上的图像是否较新。我该如何实现它?我想我可以检查时间戳或图像大小(或两者),但我不知道该怎么做。

如何仅在图像较新时才从HTTP下载图像

尝试If-Modified-Since请求字段。 http://en.wikipedia.org/wiki/List_of_HTTP_header_fields我不确定每个服务器是否完全支持它。因此,如果它不受支持并且您仍然会获得该文件(如果支持,则不是 304),您可以计算校验和,如果它们不同,则考虑修改文件。或者只是覆盖 - 您将始终拥有最新版本。

HttpWebRequest 只能使用 IE 缓存,所以如果所有图像都将在该缓存中,并且重写文件(但不必下载它)的成本是可以接受的,你可以利用它。

如果您需要自己处理它,那么:

鉴于:

string uri; //URI of the image.
DateTime? lastMod; // lastModification date of image previously recorded. Null if not known yet.
string eTag; //eTag of image previously recorded. Null if not known yet.

您必须在结束时存储它们,并在开始时再次检索它们(当不是新图像时)。这取决于你,鉴于这一点,其余的都有效:

var req = (HttpWebRequest)WebRequest.Create(uri);
if(lastMod.HasValue)
  req.IfModifiedSince = lastMod.Value;//note: must be UTC, use lastMod.Value.ToUniversalTime() if you store it somewhere that converts to localtime, like SQLServer does.
if(eTag != null)
  req.AddHeader("If-None-Match", eTag);
try
{
  using(var rsp = (HttpWebResponse)req.GetResponse())
  {
    lastMod = rsp.LastModified;
    if(lastMod.Year == 1)//wasn't sent. We're just going to have to download the whole thing next time to be sure.
      lastMod = null;
    eTag = rsp.GetResponseHeader("ETag");//will be null if absent.
    using(var stm = rsp.GetResponseStream())
    {
      //your code to save the stream here.
    }
  }
}
catch(WebException we)
{
  var hrsp = we.Response as HttpWebResponse;
  if(hrsp != null && hrsp.StatusCode == HttpStatusCode.NotModified)
  {
    //unfortunately, 304 when dealt with directly (rather than letting
    //the IE cache be used automatically), is treated as an error. Which is a bit of
    //a nuisance, but manageable. Note that if we weren't doing this manually,
    //304s would be disguised to look like 200s to our code.
    //update these, because possibly only one of them was the same.
    lastMod = hrsp.LastModified;
    if(lastMod.Year == 1)//wasn't sent.
      lastMod = null;
    eTag = hrsp.GetResponseHeader("ETag");//will be null if absent.
  }
  else //some other exception happened!
    throw; //or other handling of your choosing
}

正确实现时,电子标签比上次修改标签更可靠(注意更改的亚秒级分辨率,并反映由于不同的 Accept-* 标头而导致的不同响应)。不过,有些实现是有缺陷的(IIS6 在网络农场上没有特别的调整,带有 mod-gzip 的 Apache ),因此值得取出与电子标签相关的代码并按日期进行。

编辑:如果你想在实现HTTP缓存方面走得更远,你也可以存储过期和max-age(如果它们都存在并且不同意前者,请使用后者),如果它早于这些值建议,则完全跳过下载。我已经这样做了,它运行良好(我有一个内存中缓存,其中包含从各种 URI 返回的 XML 创建的对象的内存中缓存,如果 XML 是新的或没有更改,我会重用该对象),但它可能与您的需求无关(如果您关心比服务器建议的更新鲜,或者如果您总是在该窗口之外)。

您需要阅读 RFC 2616 和相关 RFC(在 http://www.rfc-editor.org/cgi-bin/rfcsearch.pl 处搜索 1616)。特别是,§13 很有趣,HTTP中的缓存,第 47-62 页。然后阅读相关的请求/响应标头以及您可能会返回的相关状态代码。

您可以通过HttpWebRequestHttpWebResponse类访问所有标头和状态值。

但应该注意的是,您可以向服务器询问您想要的任何内容:最终是服务器决定是否向您发送该 URI 的新表示形式。您可能希望使用 HTTP HEAD谓词而不是其GET谓词来询问服务器有关资源的信息。

HEAD 方法与 GET 相同,只是服务器不得返回 响应中的消息正文。HTTP 标头中包含的元信息 响应 HEAD 请求时应与发送的信息相同 对 GET 请求的响应。此方法可用于获取元信息 关于请求所暗示的实体,而不转移实体主体本身。 此方法通常用于测试超文本链接的有效性、可访问性、 和最近的修改。