如何仅在图像较新时才从HTTP下载图像
本文关键字:图像 HTTP 下载 何仅 新时 | 更新日期: 2024-11-06 22:23:52
我想实现以下功能:
-
C# 客户端连接到 HTTP 服务器并将映像下载到磁盘。
-
下次客户端启动时,请检查服务器上的映像是否比磁盘上的映像新,在这种情况下,客户端将覆盖磁盘上的映像。
对我来说,下载图像很容易,但我不确定如何检查服务器上的图像是否较新。我该如何实现它?我想我可以检查时间戳或图像大小(或两者),但我不知道该怎么做。
尝试If-Modified-Since
请求字段。 http://en.wikipedia.org/wiki/List_of_HTTP_header_fields我不确定每个服务器是否完全支持它。因此,如果它不受支持并且您仍然会获得该文件(如果支持,则不是 304),您可以计算校验和,如果它们不同,则考虑修改文件。或者只是覆盖 - 您将始终拥有最新版本。
HttpWebRequest 只能使用 IE 缓存,所以如果所有图像都将在该缓存中,并且重写文件(但不必下载它)的成本是可以接受的,你可以利用它。
如果您需要自己处理它,那么:
鉴于:
string uri; //URI of the image.
DateTime? lastMod; // lastModification date of image previously recorded. Null if not known yet.
string eTag; //eTag of image previously recorded. Null if not known yet.
您必须在结束时存储它们,并在开始时再次检索它们(当不是新图像时)。这取决于你,鉴于这一点,其余的都有效:
var req = (HttpWebRequest)WebRequest.Create(uri);
if(lastMod.HasValue)
req.IfModifiedSince = lastMod.Value;//note: must be UTC, use lastMod.Value.ToUniversalTime() if you store it somewhere that converts to localtime, like SQLServer does.
if(eTag != null)
req.AddHeader("If-None-Match", eTag);
try
{
using(var rsp = (HttpWebResponse)req.GetResponse())
{
lastMod = rsp.LastModified;
if(lastMod.Year == 1)//wasn't sent. We're just going to have to download the whole thing next time to be sure.
lastMod = null;
eTag = rsp.GetResponseHeader("ETag");//will be null if absent.
using(var stm = rsp.GetResponseStream())
{
//your code to save the stream here.
}
}
}
catch(WebException we)
{
var hrsp = we.Response as HttpWebResponse;
if(hrsp != null && hrsp.StatusCode == HttpStatusCode.NotModified)
{
//unfortunately, 304 when dealt with directly (rather than letting
//the IE cache be used automatically), is treated as an error. Which is a bit of
//a nuisance, but manageable. Note that if we weren't doing this manually,
//304s would be disguised to look like 200s to our code.
//update these, because possibly only one of them was the same.
lastMod = hrsp.LastModified;
if(lastMod.Year == 1)//wasn't sent.
lastMod = null;
eTag = hrsp.GetResponseHeader("ETag");//will be null if absent.
}
else //some other exception happened!
throw; //or other handling of your choosing
}
正确实现时,电子标签比上次修改标签更可靠(注意更改的亚秒级分辨率,并反映由于不同的 Accept-* 标头而导致的不同响应)。不过,有些实现是有缺陷的(IIS6 在网络农场上没有特别的调整,带有 mod-gzip 的 Apache ),因此值得取出与电子标签相关的代码并按日期进行。
编辑:如果你想在实现HTTP缓存方面走得更远,你也可以存储过期和max-age(如果它们都存在并且不同意前者,请使用后者),如果它早于这些值建议,则完全跳过下载。我已经这样做了,它运行良好(我有一个内存中缓存,其中包含从各种 URI 返回的 XML 创建的对象的内存中缓存,如果 XML 是新的或没有更改,我会重用该对象),但它可能与您的需求无关(如果您关心比服务器建议的更新鲜,或者如果您总是在该窗口之外)。
您需要阅读 RFC 2616 和相关 RFC(在 http://www.rfc-editor.org/cgi-bin/rfcsearch.pl 处搜索 1616)。特别是,§13 很有趣,HTTP中的缓存,第 47-62 页。然后阅读相关的请求/响应标头以及您可能会返回的相关状态代码。
您可以通过HttpWebRequest
和HttpWebResponse
类访问所有标头和状态值。
但应该注意的是,您可以向服务器询问您想要的任何内容:最终是服务器决定是否向您发送该 URI 的新表示形式。您可能希望使用 HTTP HEAD
谓词而不是其GET
谓词来询问服务器有关资源的信息。
HEAD 方法与 GET 相同,只是服务器不得返回 响应中的消息正文。HTTP 标头中包含的元信息 响应 HEAD 请求时应与发送的信息相同 对 GET 请求的响应。此方法可用于获取元信息 关于请求所暗示的实体,而不转移实体主体本身。 此方法通常用于测试超文本链接的有效性、可访问性、 和最近的修改。