从Excel单元格中的超链接文本中提取URL

本文关键字:文本 提取 URL 超链接 Excel 单元格 | 更新日期: 2023-09-27 17:49:49

我在excel中有一个全是超链接文本的表格,所以它基本上是一堆名称但当我点击其中一个时,它会带我到默认浏览器中的某个URL。

所以我在我的程序中从这个excel表中提取文本,但是当我从这些超链接单元格中提取时,我得到的值是里面的字符串,当我想要字符串链接到excel文件中的URL时。

所以我认为有两种方法可以做到这一点。我可以将excel文件中的所有超链接文本转换为相应的URL,或者我可以使用c#以某种方式从单元格而不是文本中提取URL值。

我不知道怎么做这两件事,但任何帮助将是非常感激的。

c#代码:

Excel.ApplicationClass excelApp = new Excel.ApplicationClass();
//excelApp.Visible = true;
Excel.Workbook excelWorkbook = 
excelApp.Workbooks.Open("C:''Users''use''Desktop''list.xls",
0, false, 5, "", "",false, Excel.XlPlatform.xlWindows, "", 
true, false, 0, true, false, false);
Excel.Sheets excelSheets = excelWorkbook.Worksheets;
string currentSheet = "Sheet1";
Excel.Worksheet xlws = (Excel.Worksheet)excelSheets.get_Item(currentSheet);
string myString = ((Excel.Range)xlws.Cells[2, 1]).Value.ToString();

至于excel文件,它只是一长行超链接的名称。例如,单元格A2将包含以下文本:

美味的饼干食谱

我想提取字符串:

http://allrecipes.com//Recipes/desserts/cookies/Main.aspx

从Excel单元格中的超链接文本中提取URL

您可以使用vba宏:

Alt+F11打开VBA编辑器并粘贴以下内容:

Function URL(rg As Range) As String
  Dim Hyper As Hyperlink
  Set Hyper = rg.Hyperlinks.Item(1)
  URL = Hyper.Address
End Function

然后你可以在工作表中使用它,像这样:

=URL(B4)

在代码中添加

string myString = ((Excel.Range)xlws.Cells[2, 1]).Cells.Hyperlinks[1].Address;

我显然建议在访问"Hyperlinks"属性之前做一些检查。

VBA函数:

  1. Alt+F11(打开Visual Basic编辑器)
  2. 点击插入->模块(添加一个模块到您的excel文件)
  3. 粘贴下面GETURL
  4. 函数的代码
  5. Alt+Q(关闭Visual Basic编辑器)

现在使用=GETURL(cell)来获取URL
示例:=GETURL(A1)将返回单元格A1

中显示的Hyperlink的URL
Function GETURL(HyperlinkCell As Range)
    GETURL = HyperlinkCell.Hyperlinks(1).Address
End Function

使用Visual Studio Tools for Office (VSTO)打开Excel工作簿并提取所有超链接。


我在Book1.xlsx的Sheet1的A1中添加了一个超链接:text = "example.com, address = "http://www.example.com"

_Application app = null;
try
{
    app = new Application();
    string path = @"c:'temp'Book1.xlsx";
    var workbook = app.Workbooks.Open(path, 0, true, 5, "", "", true, XlPlatform.xlWindows, "'t", false, false, 0, true, 1, 0);
    var sheets = workbook.Worksheets;
    var sheet = (Worksheet)sheets.get_Item("Sheet1");
    var range = sheet.get_Range("A1", "A1");
    var hyperlinks = range.Cells.Hyperlinks.OfType<Hyperlink>();
    foreach (var h in hyperlinks)
    {
        Console.WriteLine("text: {0}, address: {1}", h.TextToDisplay, h.Address);
    }
}
finally
{
    if (app != null)
        app.Quit();
}
输出:

text: example.com, address: http://www.example.com/

为什么不使用Uri类将字符串转换为URL:

Uri uri = new Uri("http://myUrl/test.html");

您可以使用VBA代码来实现这一点。按Alt + F11打开VB编辑器,插入Module,粘贴如下代码:

Sub run()    
    On Error Resume Next    
    For Each hLink In Selection    
        Range(hLink.Address).Offset(0, 1) = hLink.Hyperlinks(1).Address    
    Next    
End Sub

保存您的excel文件[在excel 2007及以上版本保存为启用宏…]

试试这个:

Excel.Application appExcel = new Excel.Application();
Excel.Workbooks workBooks = appExcel.Workbooks;
Excel.Workbook excelSheet = workBooks.Open("......EditPath", false, ReadOnly: true);
foreach (Excel.Worksheet worksheet in excelSheet.Worksheets)
{
    Excel.Hyperlinks hyperLinks = worksheet.Hyperlinks;
    foreach (Excel.Hyperlink lin in hyperLinks)
    {
        System.Diagnostics.Debug.WriteLine("# LINK: adress:" + lin.Address);
    }
}

我刚刚遇到了这个问题,这是我的工作:

我对一个范围使用了FormulaR1C1扩展方法。所以我的代码是这样的:

                    for (int r = 2; r <= sheetRange.Rows.Count; r++)
                    {
                        documentRecord = new List<string>();
                        for (int c = 1; c <= wkCol; c++)
                        {
                            documentRecord.Add(sheetRange.Cells[r, c].FormulaR1C1); 
                        }
                        AllRecords.Add(documentRecord);
                    }

当记录被添加到记录列表中时,单元格范围的值将被格式化为可点击的超链接。