侧边栏壁纸
  • 累计撰写 42 篇文章
  • 累计创建 51 个标签
  • 累计收到 7 条评论

C#正则表达式提取HTML中IMG标签中的SRC地址

小周黎
2020-04-01 / 0 评论 / 0 点赞 / 270 阅读 / 666 字 / 正在检测是否收录...
温馨提示:
本文最后更新于 2022-04-01,若内容或图片失效,请留言反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。
    /// <summary>   
    /// 取得HTML中所有图片的 URL。   
    /// </summary>   
    /// <param name="sHtmlText">HTML代码</param>   
    /// <returns>图片的URL列表</returns>   
    public static string[] GetHtmlImageUrlList(string sHtmlText)   
    {   
      // 定义正则表达式用来匹配 img 标签   
      Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>",   RegexOptions.IgnoreCase);   
      // 搜索匹配的字符串   
      MatchCollection matches = regImg.Matches(sHtmlText);   
      int i = 0;   
      string[] sUrlList = new string[matches.Count];   
      // 取得匹配项列表   
      foreach (Match match in matches)   
      sUrlList[i++] = match.Groups["imgUrl"].Value;   
      return sUrlList;   
    }  
0

评论区