htmlpdf转换
㈠ 如何将 html 转成 PDF
1这个方法是我抄认为最简单、高效的,只要安装了360浏览器、火狐浏览器或谷歌浏览器就可以轻松实现。下面笔者以360浏览器为例,我们只要在浏览器的右上角点击“文件”按钮,然后选择“打印”,然后选择另存为PDF就可以了
2选择目标另存为PDF,另存为PDF后就可以了,这个是将整个网页转换成PDF文件的,如果网页很长可能会有2、3页的PDF。目前上面笔者演示的这个功能应该是可以在所有给予Chrome内核的浏览器中实现,包括360、搜狗浏览器极速版、Chrome、猎豹浏览器,而且操作上基本都一样(凭经验猜想应该是如此)。但IE内核就没有这个功能,而火狐里面则方法不同,不过肯定有插件可以实现。
㈡ 关于PDF文件转换成HTML问题,如何将PDF转成html
HTM是网页的通用格式,但PDFTools转换HTM文件后,所形成的HTM文件并不包含有PDF文档中的回文字,而是将PDF文档的内答容转换成JPG图像文件,然后再用HTML语言将图片嵌入到网页中。生成的HTM文件是一个框架网页,即左边是各页面的链接窗口,右边的内容就是JPG图片了。如果你用的是IE6的话,当鼠标移到右边窗口后,就会浮出一排快捷工具栏。
首先选择菜单“工具→PDF转HTM”,使其转为HTM模式。接着打开文件有多种操作方式:通过菜单“文件→打开”直接按“Ctrl+F”键后调出打开对话框选择文件,或者直接把待转换的PDF文档拖到PDFTools主界面中,软件马上开始转换。转换后的文件是保存在源文件中,而且还有相应名称的子文件夹,里面就是一些JPG图片和其它资源。最后弹出一个提示窗口,点击“确定”即可。
㈢ PDF如何转成HTML网页格式
HTML格式是我们在办公中并不常见的一种文件格式,但有时候因为工作需要,我们的文档要内边看边在容浏览器上操作的,那么我们直接把文档转换成HTML网页格式就好了。当然PDF这类文档其实都是可以转换成HTML格式的,而且转换方式非常简单,只需要利用转换器就能帮我们实现了。
具体的操作步骤如下:
1、下载成功后运行并安装到我们的电脑上,然后双击打开转换器。
㈣ 如何将html页面转成pdf
java">publicbooleanconvertHtmlToPdf(StringinputFile,StringoutputFile)
throwsException{
OutputStreamos=newFileOutputStream(outputFile);
ITextRendererrenderer=newITextRenderer();
Stringurl=newFile(inputFile).toURI().toURL().toString();
renderer.setDocument(url);
//解决中文支持问题
ITextFontResolverfontResolver=renderer.getFontResolver();
fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC",BaseFont.IDENTITY_H,BaseFont.NOT_EMBEDDED);
//解决图片的相对路径问题
renderer.getSharedContext().setBaseURL("file:/D:/");
renderer.layout();
renderer.createPDF(os);
os.flush();
os.close();
returntrue;
}
上面这段代码是这样的,输入一个HTML地址URL = inputFile,输入一个要输出的地址,就可以在输出的PDF地址中生成这个PDF。
注意事项:
1.输入的HTML页面必须是标准的XHTML页面。页面的顶上必须是这样的格式:
<!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<htmlxmlns="http://www.w3.org/1999/xhtml">
并且HTML页面的语法必须是非常严谨的,所有标签都必须闭合等等(由于flying-Saucer做了XML解析的工作,不严谨会报错的。),这是对页面的第一个要求。
2.要用到图片的地方写相对路径的形式,比如:
<imgsrc="a.jpg"alt="323"width="252"height="80"/>
而它的图片位置则必须在Java代码中指定。
renderer.getSharedContext().setBaseURL("file:/D:/");
也有另一种方法就是直接在<img>标签中写绝对路径。
3.Flying-Saucer在解析tiff格式的图片的时候会报错。具体原因我还没找到。希望大家能够指点我。
4.如果在页面中有中文字体的话。必须在HTML代码中的样式中写上某种字体的css,并且必须是用英文的,然后在Java代码中写上对应的文件位置。
ITextFontResolverfontResolver=renderer.getFontResolver();
fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC",BaseFont.IDENTITY_H,BaseFont.NOT_EMBEDDED);
上面的方法是添加了宋体。也可以添加其他字体。
㈤ pdf怎么转换成html格式的
pdf转换和html格式 步骤如下:
在电脑上安装好pdf转换器
㈥ 如何将html格式转变成pdf文件
1这个方法是我认为最简单、高效的,只要安装了360浏览器、火狐浏览器或谷歌浏览器就可以轻松实现。下面笔者以360浏览器为例,我们只要在浏览器的右上角点击“文件”按钮,然后选择“打印”,然后选择另存为PDF就可以了
2选择目标另存为PDF,另存为PDF后就可以了,这个是将整个网页转换成PDF文件的,如果网页很长可能会有2、3页的PDF。目前上面笔者演示的这个功能应该是可以在所有给予Chrome内核的浏览器中实现,包括360、搜狗浏览器极速版、Chrome、猎豹浏览器,而且操作上基本都一样(凭经验猜想应该是如此)。但IE内核就没有这个功能,而火狐里面则方法不同,不过肯定有插件可以实现。
㈦ 如何将html转换成pdf文件
1、如果你的md文件使用chrome预览,就比较简单了。 点打印,目标,选本地另存为pdf,即可。
2、如果你的浏览器有虚拟的PDF打印机的,请你PDF虚拟打印机打印你要输出的内容,即可得到你要的PDF文档。
3、如果用其它浏览器,没有虚拟的PDF打印机的,请你安装Adobe Acrobat XI Pro软件,在WORD中用Adobe PDF打印机打印你要输出的内容,即可得到你要的PDF文档。
㈧ pdf 怎么把html变成pdf
方法一:
最初是在老外的网站看到 http://hmkcode.com/itext-html-to-pdf-using-java/
Java代码
// step 1
Document document = new Document();
// step 2
PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("pdf.pdf"));
// step 3
document.open();
// step 4
XMLWorkerHelper.getInstance().parseXHtml(writer, document,
new FileInputStream("index.html"));
//step 5
document.close();
System.out.println( "PDF Created!" );
Maven构建对应的版本 关于eclipse配置maven,可以参考此文
Xml代码
<dependency>
<groupId>com.itextpdf</groupId>
<artifactId>itextpdf</artifactId>
<version>5.4.2</version>
</dependency>
<dependency>
<groupId>com.itextpdf.tool</groupId>
<artifactId>xmlworker</artifactId>
<version>5.4.1</version>
</dependency>
最简单的方式,HTML支持度很好,可惜不支持中文 源码地址:https://github.com/hmkcode/Java/blob/master/itext-java-html-pdf
方法二:
使用的jar包:itext-2.0.8.jar core-render.jar
App.java
Java代码
/**
*
* @author LJS
*
*/
public class App {
public void createPdf() throws Exception {
// step 1
String inputFile = "index.html";
String url = new File(inputFile).toURI().toURL().toString();
String outputFile = "index.pdf";
System.out.println(url);
// step 2
OutputStream os = new FileOutputStream(outputFile);
org.xhtmlrenderer.pdf.ITextRenderer renderer = new ITextRenderer();
renderer.setDocument(url);
// step 3 解决中文支持
org.xhtmlrenderer.pdf.ITextFontResolver fontResolver = renderer
.getFontResolver();
fontResolver.addFont("c:/Windows/Fonts/simsun.ttc", BaseFont.IDENTITY_H,
BaseFont.NOT_EMBEDDED);
renderer.layout();
renderer.createPDF(os);
os.close();
System.out.println("create pdf done!!");
}
public static void main(String[] args) throws Exception {
App app = new App();
app.createPdf();
}
}
注意指定中文字体
要转换的HTML
index.html
Html代码
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">
<html xmlns="http://www.w3.org/1999/xhtml ">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>itext-zh-cn</title>
<style type="text/css">
body {
font-family: SimSun;
}
</style></head>
<body>
<p align="left" >OK,支持中文了:)</p>
</body>
</html>
同样也要指定中文字体,区分大小写
运行程序,转换结果:
(字体样式和大家熟知的宋体不同,因为我替换了系统默认的宋体,pdf查看工具推荐PDF-XChange Viewer)
pdf样式修改为A4 ( Document doc = new Document(PageSize.A4.rotate());)
在index.html中添加
Html代码
<style type="text/css">
@page{ size: 11.69in 8.27in;}
...
</style>
注意:无论哪种方式的Html格式转换pdf,对于html源文件要求是语法严格的;方法二支持基本的CSS样式,可以调整出合适的HTML模板。
大家有更好的方法,欢迎交流
其他:itext添加图片方法:实际应用中,应该与生成pdf合成一步提升性能
Java代码
public static void addImg(String fm) throws Exception {
PdfReader reader = new PdfReader("temp.pdf");
PdfStamper stamp = new PdfStamper(reader,new FileOutputStream("model.pdf"));
Image img = Image.getInstance("code.png"); //使用png格式
img.setAlignment(Image.LEFT | Image.TEXTWRAP);
img.setBorderWidth(10);
img.setAbsolutePosition(420, 240);
img.scaleToFit(1000, 60);// 大小
PdfContentByte over = stamp.getUnderContent(1); // overCount 与underCount
over.addImage(img);
stamp.close();
reader.close();
}
itext 版本号众多,可以在gerpcode查找其所有的版本
㈨ PDF 能转成 HTML 吗如何转换
PDF 能转成 HTML 常用Free PDF to HTML 工具。
1、下载Free PDF to HTML并安装: