我收藏了20个G左右的电子书,现在正在用业余时间整理书库。我收藏的电子书格式繁多,所以必须安装很多阅读器,它们大部分都相互不兼容。天天看书的过程中,这些数字格式的书也仿佛具有灵魂一样,相处时间长了也会产生对书的感情。

不知怎么的,我有了一种想给这些格式排排座次的想法。如果这些格式都拟人化,我会选择什么样的比喻呢?下面就慢慢地说来。

同样是扫描版图书,没几个人知道的DJVU就比大路货PDF高贵一等。就好比是风度翩翩的黑骑士。DJVU的书页有一种奇特的模式——拉伸,可以把竖开本的书横向拉伸到适合横向屏幕,字和图片都扁扁的,看来很具有能屈能伸的骑士风范。PDF则是放到人堆里绝对找不出来的普通路人。图片压缩包是处理起来非常麻烦的东西,就像唠叨不断的长舌妇。

文字方面,PDF是白领,CHM是蓝领,两个工人阶级的同盟军现在“就业形势严峻”(数量太多了,挑花了眼,不知道选哪本好)。超星Apabi的收费格式就像带点大小姐意思的宅女,轻易没法撬动她们的心门(当然付了钱就可以了),对迎娶她们的花轿也十分挑剔(必须用专属阅读器)。

TXT则像农民伯伯一样,数量众多,勤劳勇敢,到哪里都能生存(管你是手机、PSP还是山寨MP4)。DOC、PPT两兄妹在夜晚的街巷里,顶着寒风瑟瑟发抖(请脑补“卖女孩的小火柴”不不,“卖火柴的小女孩”)。他们就像刚刚失业了,没领到救济金,在城市中流浪的可怜孩子。TXT和Office格式电子书同属于格式王国里的“弱势群体”,之所以这么说是因为它们太容易被修改了,简直是任人宰割。当然,它们都可以导出为PDF,换句话也就是让自己的孩子改头换面,出人头地。

如果你不知道TeX的话最好去维基百科查一查。作为学术界公认的论文格式,TeX就像身居宫内的王子一样,神秘且高贵,似乎不可接近。然而真的接近了,就会发现它原本是由纯粹的代码组成的,就像HTML一样,其实是一种标记语言。该说TeX是贵人也有平常心呢,还是说它跟TBBT里的Sheldon那样都有一颗永远钻牛角尖的Geek灵魂?

格式王国里和我国的花朵们一样,也有一个“青少年群体”。JAR、CAB、SIS、BRM等等手机电子书格式就像我们身边的“90后非主流”一样,不走寻常路,特立独行。在“非主流”的圈子里,还有一位统治地位比春哥还牢固的精神领袖,这个格式不是别的,正是大名鼎鼎的EXE

打开EXE的时候你能更加强烈的感受到这一点——该是怎样的胸怀才能让EXE里面包容那么广泛的杂交内容:图片、网页、甚至声音和视频。而且,EXE打包的电子书,有的就像非主流一样,使用大大咧咧的12磅宋体制作的网页,附加上JS的页面切换效果,甚至还有包含了Java Applet水纹特效的,鼠标滑过图片就开始下雨点;有的则采用Flash制作,傻瓜化的操作就可以让黑蝴蝶啦摩天轮啦华丽丽的在页面上跑火车。可以说,EXE电子书从以前的网页格式到如今的Flash格式,也在承前启后,继往开来的脑残着。信EXE,没有不可能!

……

说着说着,就越发感觉不同的格式就像人类社会的不同人群一样,有它们自己的风格与个性。

我自己的希望是能够让格式尽可能的统一,为此我有时要转换一些书的格式。我会把书尽可能的转换为TXT格式,因为它最节省空间,而且可以放在更好的阅读器里放大阅读,任意改变版式。但是,PDF等等原版扫描的图书,还有精确还原的图书我也很喜欢。相比之下CHM或者EXE就不怎么喜欢,就像现实里我也不太喜欢火星文脑残体。

以前有一段时间,我对世界上那么多的格式、标准和语言迷惑不解。为什么市场占有率最高的格式并没有形成垄断?为什么小格式虽然用的人不多却一直在发展存活,然而又始终抢占不了通用格式的份额,就那么偏安在格式王国的一隅?为什么不同格式之间明明差异没多少却还是要区分开来?

记得以前曾经问过一个做网页程序的家伙,既然已经有了PHP,为啥还要设计Ruby On Rails——我承认这是一个很傻瓜的问题。他回答说:因为原来的格式有缺陷。言简意赅。“缺陷”,是一个完全主观的概念。在甲眼中的缺陷可能正是乙眼中的优势,就像代码狂人和图形界面爱好者,严肃的老学究和轻松活泼的90后的区别一样。他们当然要开发和拥护自己喜欢的新格式。

另外一个在苦苦挣扎补上挂掉的科目的理科兄弟,电脑里几大数学软件Matlab、Maple等等一应俱全。它们的格式都可以互相转化,而且都是基于C的,彼此之间只有很微小的差异。我就问他,为什么这些软件的格式不能通用?他回答说:有些功能只有依赖特殊的格式封装才能完美的实现。兼容永远只是兼容。我想有些家伙能用Office就不用WPS的道理可能也类似吧。

当然,更主要的是一些麻烦的和我们无力影响的因素:版权啦,商业利益啦,专利啦。但是,因为这些格式必须存在,而且谁都不能消灭谁,才诞生了像上面所说那样拥有奇妙个性与“人格”的格式王国。

也许程序猴子们可以用拟人来形容各种语言,下载达人们可以比较一下各种协议,还可以比较一下各种浏览器、操作系统、智能手机什么的。但我觉得上面那些对格式的拟人化自己更加拿手一点,其他的可能早就有人总结过了吧。最后要吐的一句就是,以前看过一篇讲图书馆的书香门第的文章,当然纸质书籍排山倒海的气势会让人萌发对知识的敬畏之情,就像走进教堂即使不信教也会被沉重的罪感压倒一样。但是并不是说数字化了的书就完全了无生气,没有乐趣。你看,这些20个G的电子书在我的硬盘里,不也活得一样有声有色,值得玩味吗?

打赏
  • Chris

    最喜欢 CHM, 打开速度快, 搜索跳转放大缩小等等都很方便, pdf 很考研制作者的品德和技术, 大多数文字和图片都是不清晰的