在没有安装MS Word的情况下将html导出到Word的最佳方法?

在没有安装MS Word的情况下将html导出到Word的最佳方法?

Best way to export html to Word without having MS Word installed?

是否可以在不安装Microsoft Word的情况下将简单的HTML页面导出到Word(.doc格式,而不是.docx)?


如果您只有所说的简单HTML页面,则可以使用Word打开它。

否则,有些图书馆可以做到这一点,但是我没有经验。

我的最后一个想法是,如果您使用的是ASP.NET,请尝试将application/msword添加到标题中,然后将其保存为Word文档(它不是真正的Word文档,仅将HTML重命名)到doc即可打开)。


有一个名为JODConverter的工具,该工具可以挂接到开放式办公室以公开其文件格式转换器,还有发布到Web应用程序(位于tomcat中)的版本以及一个命令行工具。我一直在用它发射html并将其成功转换为.doc和pdf,这是一个相当大的项目,尚未投入使用,但我想我会使用它。
http://sourceforge.net/projects/jodconverter/


有一个名为HTMLtoWord的开源项目,该项目允许用户将格式良好的HTML(XHTML)的片段作为格式文本插入到Word文档中。

HTMLtoWord文档


如果您使用的是Java,则可以使用我在docx4j 2.8.0中发布的代码将HTML转换为真正的docx内容。我说"真实"是因为替代方法是创建一个HTML altChunk,它依靠Word进行实际的转换(首次打开文档时)。

请参阅以ConvertInXHTML为前缀的各种示例。导入过程需要格式良好的XML,因此您可能必须先对其进行整理。


尽管可以制作一个" .doc" Microsoft Word文件,但制作一个" .rtf"文件可能更容易,更可移植。


如果只是HTML,则只需将扩展名更改为.doc,Word就会像打开Word文档一样打开它。但是,如果有要包含的图像或要运行的javascript,可能会变得更加复杂。


我假设您希望通过" C#"标记以编程方式实现此目标。

尝试.NET的Aspose.Words。


好吧,有很多第三方工具可以做到这一点。我不知道它是否比这更简单。

示例:

  • http://htmltortf.com/
  • http://www.brothersoft.com/windows-html-to-word-2008-56150.html
  • http://www.eprintdriver.com/to_word/HTML_to_Word_Doc.html

还发现了一个vbscribt,但我猜测这要求您安装Word。


使用此链接导出为word,但是此处的图片无效:

http://www.jqueryscript.net/other/Export-Html-To-Word-Document-With-Images-Using-jQuery-Word-Export-Plugin.html


您可以使用Libreoffice Writer打开html文件。然后,您可以从"文件"菜单导出为PDF。浏览器也可以将html导出为PDF文件。


我认为开放办公室可以同时打开.html文件和创建.doc文件


推荐阅读