OurJS


OurJS-我们的JS, 我们的技术-IT文摘; 专注JS相关领域;
我们热爱编程, 我们热爱技术;我们是高大上, 有品味的码农;

欢迎您订阅我们的技术周刊


我们会向您分享我们精心收集整理的,最新的行业资讯,技术动态,外文翻译,热点文章;
我们使用第三方邮件列表向您推送,我们不保存您的任何个人资料,注重您的隐私,您可以随时退订,

欢迎分享您的观点,经验,技巧,心得

让我们一起找寻程序员的快乐,探索技术, 发现IT人生的乐趣;


本网站使用缓存技术每次加载仅需很小流量, 可在手机中流畅浏览;
如果您发现任何BUG,请即时告知我们: ourjs(at)ourjs.com

从PDF转换到HTML5的三种方法,你用过吗?


分享到
关键字 Html5   发布 AprilJ  1445181856741
注意 转载须保留原文链接,译文链接,作者译者等信息。  

1、把PDF字体转换为web字体和可选择的文本

如果你想让文本是可选的,有两种方法可以实现它。第一种方法是把PDF字体转换为Web浏览器的兼容字体,并使用可用的字体得到HTML文本。虽然这是一个很平常的过程,PDF文件格式没有包含浏览器兼容的字体,有很多的注意事项会让精确地转换字体变为一个噩梦。这就是为什么很少看见PDF文件到HTML格式转换的工具能保留字体的原因。

除此之外,PDF文件格式以非常简洁的方式对文本大小,定位和字距调整都有很好的控制。HTML并不是设计用来处理使转换文本变得困难的控制功能,更加精确的转换以及较大HTML文件的转换功能将会被保留。解决办法是在精确度的保留上面作出让步,平均间距超过一整行会比使用单个字符间距更佳。

2、把PDF字体转换为图形和类似图形的文本

如果你唯一的要求是视觉上的完美匹配,那么最好的选择是把PDF文件转换为图形,并输出为图像或者矢量图形。这样的好处是你能得到完美的视觉效果,然而该文件不会产生任何的包含文本。这对搜索引擎不好,也意味着不能够选择和复制或粘贴文

3、把PDF字体转换为图形和类似图形的文本,也会有看不见的真实文本来允许文本选择

如果你需要完美的匹配和文本选择,可以通过写在外面的文字作为形状并把用于选择的看不见的文字层放在顶部来实现。这也意味着可见的文件将会非常完美,任何轻微的不准确的字体或真实的文本定位将会看不见。

有很多的方法可以实现这个功能,例如由于比起把真实的文字放在这里,上述的方法更容易实现,一甚至些工具建还立了它们自己的搜索引擎。其它一些工具使用真实的文本转换为正常的尺寸,然虽然并没有转换字体

你认为哪种是最好的呢?

在我们看来方法一是最好的,虽然它最困难,这就是为什么它最少见的原因了。这就是我们展示PDF到HTML5转换最喜欢的模式。如果你想了解更多,你可以试试我们免费的PDF与HTML的转换器,或者找到更多的关于我们的信息并下载试用版。

本文翻译自blog.idrsolutions.com

社区评论 ( Beta版 )
OnceDoc 您自己的企业内容管理系统——文档、流程、知识库、报表、网盘All In One

访问404页面,寻找丢失儿童
 热门文章 - 分享最多
  1. QRCode:用纯JavaScript实现的微信二维码图片生成器
  2. ES6中的Map与JSON的相互转化(序列和持久化)
  3. JavaScript也有getter/setter方法:ES5 Object对象的5个不为人知的特性
  4. Stop-Server:用手机关闭你的电脑
  5. 掌握Node.js的文件系统[File System 基础]
  6. 探讨Uber如何利用大数据取得巨大商业成就
  7. 编写高扩展性JavaScript的几个技巧(一)
  8. 测试一下
  9. AirJD-简单好用的免费建站工具

 相关阅读 -
  1. 从PDF转换到HTML5的三种方法,你用过吗?
  2. 探讨Uber如何利用大数据取得巨大商业成就
  3. 掌握Node.js的文件系统[File System 基础]
  4. Stop-Server:用手机关闭你的电脑
  5. JavaScript也有getter/setter方法:ES5 Object对象的5个不为人知的特性
  6. QRCode:用纯JavaScript实现的微信二维码图片生成器
  7. ES6中的Map与JSON的相互转化(序列和持久化)
  8. JavaScript正在变成Web界的C++
  9. 用jQuery和JavaScript深度复制JSON对象的方法
  10. 请停止将JavaScript类型化(建议不要使用class实现类继承)

 关键字 - Html5
  1. 让Select选择框可编辑可输入可自动补全可下拉选择
  2. 创造canvas的艺术
  3. 用纯CSS实现的箭头
  4. HTML5的TCP和UDP Web Socket API草案定稿
  5. 传统广告与H5广告的差别在哪里?
  6. WeMall微信商城源码插件代金券部分代码
  7. WeMall微信商城源码插件会员卡代码详情
  8. WeMall微信商城源码插件大转盘代码详情
  9. 你应该使用HTML5的header和footer标签吗?
  10. 5个实用Web界面设计工具 | 附开发案例

 欢迎订阅 - 技术周刊

我们热爱编程, 我们热爱技术; 我们是高端, 大气, 上档次, 有品味, 时刻需要和国际接轨的码农; 欢迎您订阅我们的技术周刊; 您只需要在右上角输入您的邮箱即可; 我们注重您的隐私,您可以随时退订.
加入我们吧! 让我们一起找寻码农的快乐,探索技术, 发现IT人生的乐趣;


 关注我们

我们的微信公众号: ourjs-com
打开微信扫一扫即可关注我们:
IT文摘-程序员(码农)技术周刊

ourjs官方微信号