不能下载维基百科文章

本文关键字:百科 文章 下载 不能 | 更新日期: 2023-09-27 18:10:00

我有一个基于c#控制台的应用程序(Windows 10, VS2015),我想从两个维基百科文章下载原始文本。维基百科的url包含小写字母,其中一个给我带来了一些麻烦。下面是获取web响应的代码:

WebRequest.Create("https://en.wikipedia.org/wiki/Albrecht_Dürer").GetResponse();
WebRequest.Create("https://en.wikipedia.org/wiki/Dürer's_Rhinoceros").GetResponse();
WebRequest.Create("https://en.wikipedia.org/wiki/Durer's_Rhinoceros").GetResponse(); 

第三个响应用于测试目的,与第二个响应相同,只是我将'ü'替换为'u'。所以第一个反应正常,第二个反应失败,第三个反应正常。起初我认为这只是一个变音符,但如果是这样的话,那么第一个响应就不起作用了。我收到的第二个响应的错误是:

System.Net.WebException: Too many automatic redirections were attempted.

而且,当我在我的Windows Phone 8.1 Silverlight项目上测试它们时,这三个响应都有效。有人知道是怎么回事吗?

不能下载维基百科文章

应该使用System.Web.HttpUtility.UrlEncode()对url进行编码。您也可以尝试使用System.Uri.EscapeDataString()

我想单引号会产生问题。使用上述方法,单引号应转换为%27