如何阅读包含HTML的Lync对话文件?

用户名

我在用C#将本地文件读入字符串时遇到麻烦。

到目前为止,这是我想到的:

 string file = @"C:\script_test\{5461EC8C-89E6-40D1-8525-774340083829}.html";
 using (StreamReader reader = new StreamReader(file))
 {
      string line = "";
      while ((line = reader.ReadLine()) != null)
      {
           textBox1.Text += line.ToString();
      }
 }

具有文件中文本的文本框

这是唯一可行的解​​决方案。

我尝试了一些其他建议的方法来读取文件,例如:

string file = @"C:\script_test\{5461EC8C-89E6-40D1-8525-774340083829}.html";
string html = File.ReadAllText(file).ToString();
textBox1.Text += html;

在此处输入图片说明

但是它没有按预期工作。

这是我尝试读取的文件的前几行:

在此处输入图片说明

如您所见,它有一些时髦的字符,老实说,我不知道这是否是这种怪异行为的原因。

但是在第一种情况下,代码似乎跳过了这些行,仅打印“ Office Communicator生成的文档...”。

用户名

我不知道这是否是正确的答案,但是到目前为止,这是我设法做到的:

        string file = @"C:\script_test\{1C0365BC-54C6-4D31-A1C1-586C4575F9EA}.hist";
                    string outText = "";
        //Encoding iso = Encoding.GetEncoding("ISO-8859-1");
        Encoding utf8 = Encoding.UTF8;
        StreamReader reader = new StreamReader(file, utf8);
        char[] text = reader.ReadToEnd().ToCharArray();
        //skip first n chars
        /*
        for (int i = 250; i < text.Length; i++)
        {
            outText += text[i];
        }
        */
        for (int i = 0; i < text.Length; i++)
        {
            //skips non printable characters
            if (!Char.IsControl(text[i]))
            {
                outText += text[i];
            }
        }
        string source = "";
        source = WebUtility.HtmlDecode(outText);
        HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
        htmlDoc.LoadHtml(source);

        string html = "<html><style>";
        foreach (HtmlNode node in htmlDoc.DocumentNode.SelectNodes("//style"))
        {
            html += node.InnerHtml+ Environment.NewLine;
        }
        html += "</style><body>";
        foreach (HtmlNode node in htmlDoc.DocumentNode.SelectNodes("//body"))
        {
            html += node.InnerHtml + Environment.NewLine;
        }
        html += "</body></html>";
        richTextBox1.Text += html+Environment.NewLine;

        webBrowser1.DocumentText = html;

康沃历史

对话正确显示,包括样式和编码。

所以这对我来说是一个开始。

谢谢大家的支持!

编辑

Char.IsControl(char)

跳过不可打印的字符:)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在VB.net的“打开文件”对话框中包含消息框

来自分类Dev

在可可中阅读后如何关闭文件

来自分类Dev

如何包含html中包含的html文件?

来自分类Dev

如何阅读NYTProf html报告?

来自分类Dev

如何在rails中包含html文件?

来自分类Dev

Perl如何从下至上阅读HTML

来自分类Dev

如何将HTML代码包含在Jade文件中?

来自分类Dev

如何阅读 Java中分离的csv文件?

来自分类Dev

如何在html中包含javascript文件?

来自分类Dev

如何在HTML文件中包含markdown(.md)文件

来自分类Dev

无论安装了Lync客户端版本如何,都可以从C#WPF桌面应用程序启动Lync对话

来自分类Dev

如何在Jekyll帖子中包含Rmarkdown / HTML文件

来自分类Dev

如何在.ts文件中包含HTML

来自分类Dev

如何在HTML文件中包含npm包?

来自分类Dev

如何创建一个包含下拉列表的HTML对话框?

来自分类Dev

如何动态包含包含javascript的html文件

来自分类Dev

如何阅读NYTProf html报告?

来自分类Dev

如何连续阅读文本文件

来自分类Dev

如何在包含json的html中包含.js文件?

来自分类Dev

如何在rails中包含html文件?

来自分类Dev

如何逐字阅读文件

来自分类Dev

如何使IDE识别HTML文件中包含jquery?

来自分类Dev

如何使PHP包含HTML文件并更改DIV align属性?

来自分类Dev

如何加载包含html标记的.txt文件而不用html解释?

来自分类Dev

如何正确使用HTML5文件阅读器的onload方法

来自分类Dev

如何在 HTML 中包含头文件

来自分类Dev

如何打开 Acrobat Reader 阅读 pdf 文件?

来自分类Dev

如何阅读/查看 .x 文件

来自分类Dev

如何包含用户上传的 HTML 文件 - Django

Related 相关文章

热门标签

归档