使用韩国语言的Curl-Lib下载html

本文关键字:Curl-Lib 下载 html 语言 韩国 韩国语 | 更新日期: 2023-09-27 18:19:28

我正在使用Curl LIB下载韩国网站的html,但问题是我看不到正确的网站字符。示例如下:

示例我想得到的价格是:

42,000원

但当我得到HTML时,我得到的是:

42,000��

和所有其他韩国角色一样该怎么办?我过去遇到过类似的事情,但那是在HTTPWEBREQUEST中,但现在不知道如何处理。

感谢您的帮助。

更新

这是一个示例链接韩国样品网站。我使用的函数如下(Curl-Lib):

 public string Post(string URL, string post,string refferer)
    {
        result = "";
        try
        {
            string UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:21.0) Gecko/20100101 Firefox/21.0";
            Curl.GlobalInit((int)CURLinitFlag.CURL_GLOBAL_ALL);
            Easy easy = new Easy();
            Easy.WriteFunction wf = new Easy.WriteFunction(OnWriteData);
            easy.SetOpt(CURLoption.CURLOPT_URL, URL);
            easy.SetOpt(CURLoption.CURLOPT_REFERER, refferer);
            easy.SetOpt(CURLoption.CURLOPT_TIMEOUT, "6000000");
            easy.SetOpt(CURLoption.CURLOPT_WRITEFUNCTION, wf);
            easy.SetOpt(CURLoption.CURLOPT_USERAGENT, UserAgent);
            easy.SetOpt(CURLoption.CURLOPT_COOKIEFILE, CookieFile);
            easy.SetOpt(CURLoption.CURLOPT_COOKIEJAR, CookieFile);
            easy.SetOpt(CURLoption.CURLOPT_FOLLOWLOCATION, true);
            easy.SetOpt(CURLoption.CURLOPT_ENCODING,Encoding.UTF8); // NOT SURE OF THIS
            if (post != "")
            {
                easy.SetOpt(CURLoption.CURLOPT_POST, true);
                easy.SetOpt(CURLoption.CURLOPT_POSTFIELDS, post);
            }

            if (URL.Contains("https"))
            {
                easy.SetOpt(CURLoption.CURLOPT_SSL_VERIFYHOST, 1);
                easy.SetOpt(CURLoption.CURLOPT_SSL_VERIFYPEER, 0);
            }
            easy.Perform();
            easy.Cleanup();
        }
        catch (Exception ex)
        {
            Console.WriteLine(ex);
        }
        return result;
    }

我需要添加什么来获得返回的html作为:

..meta name="description" content="시크릿라벨 ♩">
..meta name="keywords" content="시크릿라벨">

而不是到处都是CCD_ 3。

使用韩国语言的Curl-Lib下载html

这为我解决了问题:

 result += Encoding.GetEncoding(949).GetString(buf);