使用韩国语言的Curl-Lib下载html
本文关键字:Curl-Lib 下载 html 语言 韩国 韩国语 | 更新日期: 2023-09-27 18:19:28
我正在使用Curl LIB
下载韩国网站的html,但问题是我看不到正确的网站字符。示例如下:
示例我想得到的价格是:
42,000원
但当我得到HTML时,我得到的是:
42,000��
和所有其他韩国角色一样该怎么办?我过去遇到过类似的事情,但那是在HTTPWEBREQUEST
中,但现在不知道如何处理。
感谢您的帮助。
更新
这是一个示例链接韩国样品网站。我使用的函数如下(Curl-Lib):
public string Post(string URL, string post,string refferer)
{
result = "";
try
{
string UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:21.0) Gecko/20100101 Firefox/21.0";
Curl.GlobalInit((int)CURLinitFlag.CURL_GLOBAL_ALL);
Easy easy = new Easy();
Easy.WriteFunction wf = new Easy.WriteFunction(OnWriteData);
easy.SetOpt(CURLoption.CURLOPT_URL, URL);
easy.SetOpt(CURLoption.CURLOPT_REFERER, refferer);
easy.SetOpt(CURLoption.CURLOPT_TIMEOUT, "6000000");
easy.SetOpt(CURLoption.CURLOPT_WRITEFUNCTION, wf);
easy.SetOpt(CURLoption.CURLOPT_USERAGENT, UserAgent);
easy.SetOpt(CURLoption.CURLOPT_COOKIEFILE, CookieFile);
easy.SetOpt(CURLoption.CURLOPT_COOKIEJAR, CookieFile);
easy.SetOpt(CURLoption.CURLOPT_FOLLOWLOCATION, true);
easy.SetOpt(CURLoption.CURLOPT_ENCODING,Encoding.UTF8); // NOT SURE OF THIS
if (post != "")
{
easy.SetOpt(CURLoption.CURLOPT_POST, true);
easy.SetOpt(CURLoption.CURLOPT_POSTFIELDS, post);
}
if (URL.Contains("https"))
{
easy.SetOpt(CURLoption.CURLOPT_SSL_VERIFYHOST, 1);
easy.SetOpt(CURLoption.CURLOPT_SSL_VERIFYPEER, 0);
}
easy.Perform();
easy.Cleanup();
}
catch (Exception ex)
{
Console.WriteLine(ex);
}
return result;
}
我需要添加什么来获得返回的html作为:
..meta name="description" content="시크릿라벨 ♩">
..meta name="keywords" content="시크릿라벨">
而不是到处都是CCD_ 3。
这为我解决了问题:
result += Encoding.GetEncoding(949).GetString(buf);