教科书上说,人与动物的根本区别在于会使用劳动工具,然而小黑却觉得是意识、思想与信仰。人作为高级动物,在进化过程中拥有了文字,可以交流思想、意识与信仰。可以说,文字是人类进入文明时代的标志,考古界将文字的出现作为界定文明的重要标志,历史学家们认为文字的出现,使人类的生产经验与知识得到继承、传播与发扬。
从古代到近代,龟甲、书简、兽皮、丝绸布匹、纸张都曾经作为文字的载体,到了近代个人电脑的出现,让电子文档成为文字新的呈现方式。如今,常用的电子文档文件格式包括PDF、Word、TXT等。在不同的场景下,我们使用不同的电子文档格式,比如写稿、写论文时,通常使用Word来编辑;而发通知、做标书、财报或者制作电子书以供阅读时,往往使用PDF文档格式。
日常工作生活中,这几种电子文档格式小黑都有涉猎,在使用中小黑发现Word格式编辑方便,修改内容时十分方便,而PDF文档一旦保存就很难修改,还有一些通过照片拍摄的PDF格式电子书,根本无法编辑文字内容,只能通过标注、下划线等工具在文档上添加备注。
Word格式与PDF格式在功能上各有优劣,有时候小黑只好通过格式转换来修改文档,以便在不同场景与用途下使用。在转换过程中,小黑发现PDF格式暗藏不少变身技巧,这些实用性极强的技巧,大部分网友都未曾接触!
PDF设计的初衷
前文说到,PDF格式难以修改内容,其实这也是它被设计出来的初衷之一。PDF的设计公司是大名鼎鼎的Adobe,这一点很多小伙伴都知道。但是大家或许不知道,Adobe两位创始人约翰·沃诺克和查尔斯·格什克从当时的大公司施乐出来创业,很大一部分原因是因为施乐公司不愿意将控制印刷的InterPress图形语言商业化。
▲Adobe旗下产品
约翰·沃诺克和查尔斯·格什克组建了Adobe之后,使PostScript页面描述语言得到商业化应用,接着两人推进了一个名叫“Camelot”的项目,它随后发展成了PDF。PDF起初只是一种文本页面预览格式,主要是出于为方便电子打印的目的。但时值电子阅读兴起,PDF又转变为一款电子书阅读格式。
小黑有个习惯,喜欢逛旧书店,在破旧的书摊中淘一些旧书。在长时间闲逛中,小黑发现上世纪八九十年代出版的书籍中,有很多盗版书,错别字多、印刷质量差。相比较纸质书籍,电子书不需要印刷,也不会随着时间的流逝而变色,但是电子书同样容易出现错漏,不同格式的书籍在不同设备中还会出现格式不兼容的情景。
小黑不止一次经历过,自己辛辛苦苦在Word上写好的文字,传给同事朋友却是一串乱码。当然,这样的情景绝对不会出现在PDF文档中,同一份Word文档,或许在Windows操作系统和macOS上的展示效果不同,但是PDF文档不会,无论经过几层传输,PDF文档依旧在不同机器、不同操作系统上显示出视觉内容完全一致的内容。
拍照与PDF文档的结合
PDF格式便于阅读,在传播过程中也不会因为系统、设备变化而改变,因此在传输需要保存的文件时,小黑常常使用PDF文档。不过在现代化通讯工具面前,拍照成为采集文档最方便的方式。
比如说小黑桌子上摆着一张纸质文件,小黑将其转给他人,最简单的方式自然是拍照发送,但是拍照的照片不仅不便于浏览,还不能像文档一样按照页码编订成册。这时候,我们可以通过小工具将照片转换成PDF文档。
随手拍照最方便的设备自然是智能手机,因此PDF转换小工具自然也是手机软件,小黑经常用OCR文字识别工具,不仅可以扫描成PDF文档,还能直接转换为可编辑文本。以下载量最高的扫描全能王与白描为例,两者都能完成小黑的大部分需求。
▲文档扫描拍照
两款APP界面设计都相当简单,基本没有门槛。白描可以直接在图库里选择图片转为PDF文档或者文字识别,也能直接拍照识别。小黑随便在书架上找一本书,点击拍摄得到照片后,选择右上角转换符号就能将图片导出为PDF格式。
▲识别过程中分区
而下方三个按钮分别是裁剪/旋转、色彩与文字识别,其中裁剪/旋转是为了让图片中的文字更加方正,以便于识别;色彩可以调节锐度、灰度与黑白文档,同样可以提高识别率;文字识别按钮顾名思义,正是用来识别图片文字。小黑点击之后,惊人的事情发生了,图片中的文字一个个呈现在文档中。小黑对比原照片,几乎没有发现错漏之处,甚至连英文与标点符号都完美复制。
▲识别结果对比
在经历了白描带来的惊喜之后,小黑又测试了全能扫描王。相比白描,全能扫描王广告语VIP功能更多,像多页扫描、身份证扫描都是付费功能,而白描多页扫描免费,不提供名片识别、身份证识别等功能。
扫描过程与白描类似,进入调整图片色彩的页面,可以转变为比较清晰的扫描件图片,如果要文字识别,点击下方的“OCR”按钮,会弹出一个整页识别还是局部识别的一个选择框,如果选择整页识别,则直接开始识别,如果选择局部识别,还要再弹出一个裁剪框裁剪,识别完成后弹出结果来,可以编辑和分享。值得注意的是,编辑和分享也属于高级功能,包月费用为28元每月。
▲高级版付费
免费实现PDF格式转换
OCR文字识别工具本质上属于图片转文字,以及图片转PDF文档,小黑最想了解的PDF文档转可编辑文档依然不能解决。PDF文档转换,手机软件不方便,还得电脑软件出马。
在应用市场,存在着大大小小的PDF转换器,它们提供各式各样的PDF衍生服务,在PDF转Word这一功能上表现各不相同。以嗨格式为例,这是一款常用的PDF转换器,小黑在使用时发现只能转换一张,其他张需要付费使用。
PDF转Word不行,反过来Word转PDF同样不行,需要开通VIP才能享受这些功能。在应用市场中,有不少转换器都是这样,功能强大但需要付费,不开通VIP基本功能都没法享受。
嗨格式等转换器不提供免费转换,并不代表所有的软件都要付费。在测试了好几款PDF转换器之后,小黑发现福昕PDF转换器可以免费转换。小黑在百度搜索上下载一篇页的PDF格式内容,上传福昕PDF转换器,然后开始测试。
福昕PDF转换器确实可以正常转换,但是一次性只能转5页,再多就需要开会员了。转换效果相当不错,基本上将原来的内容完整转换,除了排版略有些不同,几乎没有差异。
▲福昕PDF转换结果
在不付费的情况下,福昕PDF转换器可以满足轻度用户的使用需求,如果我们的转换需求在5页、10页左右,福昕PDF转换器免费版就够了。如果转换需求在几十页、几百页,就需要另寻方法,抑或是开通VIP。
▲只能转5页
在小黑心中,PDF转换格式技术难度不大,完全没必要付费。在电脑软件之外,还有不少网站提供转换服务,而且不需要付费,或者通过某种办法规避。
超级PDF就是一款免费转换网站,它分为图片文字识别、PDF转换、PDF处理功能。其中图片文字识别需要付费,而PDF转换则可以免费使用。小黑上传了之前下载的文档,随即开始测试。
▲订单完成提醒
整个过程中没有任何付费窗口弹出,大约2分钟时间,