简介:关于格式支持方面的的相关大学硕士和相关本科毕业论文以及相关格式支持论文开题报告范文和职称论文写作参考文献资料下载。
作者署名:吴弃疾 胡大卫 段学俭
“基于内容对象的协同编纂与动态发布系统” (以下简称本系统)是上海世纪出版股份有限公司实施的一个出版流程数字化改造项目.该项目由上海市科学技术委员会和上海市论文范文支持,目标是通过对数字出版的技术研究和创新,建立一套适合大型出版集团的,面向内容对象的、具有相当强的通用性的协同编纂和动态出版系统.它通过数字化的手段,完善出版社的现有业务模式,打造新型出版流程,从而提高出版社的核心竞争力.
处理各种类型的文档格式,并达成各种文档格式的比较自由的相互转换,是本系统的主要业务之一.系统中业务数据的产生、管理和发布,在相当大程度上都体现为把文档作为某一特定格式存储,或者对它进行转换.
本系统中处理的
主要文档格式
通常使用的文档格式,在本系统中都能得到较好的处理.
kindle支持的格式:MXF格式转换贴片广告格式支持影院服务器
1.txt格式
txt是微软附带在其操作系统上的最常见简单的文本格式,我们平时也称呼它为纯文本,因为txt主要保存文字信息,基本上不带样式也不支持图像.基于此,它有容量小,兼容性好等优点,同时,也存在信息不丰富,不生动等缺陷.
2.doc/docx格式
doc是word文档格式,支持图像、表格、多媒体、数学公式等,可容纳大量文字格式、脚本语言等信息.所以具有应用广泛,表现丰富等优点.但因为该格式是属于封闭格式,因此其兼容性较差.
docx是word2007以上版本使用的文档格式,其实质上是一个zip包.如果我们把后缀从docx改为zip并解压,可清楚的发现docx文档中包含的各种信息,例如:主要文本内容保存于名为“word”的子文件中的document.xml文件中,图片等其它文件保存于名为“media”的子文件中.由于docx是用新的基于xml的压缩文件格式取代了其以前专有的默认文件格式,所以其兼容性与扩展性有了本质上的提升.
3.fbd格式
fbd是方正书版(北大方正自主开发的传统排版软件)的小样文件格式,支持命令行方式的批处理排版、支持自动抽取目录、排序、索引等,支持拼音、注音、大字库等特殊要求,快捷规范,能满足出版行业的排版需求.但其属于专业领域的自主格式,不支持所见即所得,普遍性、兼容性、扩展性都比较差.
4.ffx格式
ffx是方正飞翔(方正公司2009年发布的论文范文排版设计软件)的文档格式,在原有的专业基础上,增加了对word的兼容性,支持xml标准,支持长文档处理,支持自然语言方式的公式输入(专利技术),支持图表等的专业处理,支持拼音等特殊要求,支持标准pdf、cebx输出,支持灾难恢复等,赢得了出版业内人士的认可.
5.html格式
html全称Hyper Text Mark-up Language,即超文本标记语言,是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言.html的结构包括头部(Head)、主体(Body)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容:由html命令组成的描述性文本,可以说明文字、图形、动画、声音、表格、链接等.由于它的本质是一系列标签的集合,所以具有简易性、可扩展性、与平台无关等优点.但目前它在效能以及部分数据(如化学公式、音乐符号等)的表现上仍然存在缺陷.
6.xml格式
xml全称Extensible Markup Language,即可扩展标记语言.它与html很相似,都是SGML(Standard Generalized Markup Language,标准通用标记语言)的某种简化.不同之处在于:xml侧重于数据本身.而html侧重于数据的显示模式.所以,xml是跨平台的,是处理结构化文档信息的重要工具,是以内容为核心的技术,更为简单规范.这一特点,使它在数据存储、交换、共享方面拥有充分的优势.而样式方面,则可以交给xls (Extensible Style Language)控制.这种内容和样式的分离,给用户需求提供了更多的表现灵活性,是目前发展的潮流和方向.
7.wmI格式
wml全称Wireless Markup Language.即无线标记语言.它是基于xml的标记语言,属于xml的子集,相对于html而言更为严格简洁,所以相比html编写的内容要消耗网络浏览器更少的内存和CPU时间, 使得wml对广域网和移动设备来说更加友好.
8.pdf格式
pdf全称Portable Document Format,即便携文件格式.它由adobe公司开发,以PostScript语言图像模型为基础,可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中,并使用工业标准的压缩方式,使其具有相对较小的容量,便于存储和传输.它还支持超链接、多媒体、长文件等,安全性也比较高.而pdf的最大特点还在于其能忠实的再现原稿的文字、图像、颜色等展现形式并且与操作系统平台无关.这些特性使pdf在出版业中广泛应用.
9.cebx格式
cebx全称Common e-Document of Blending XML,即基于混合xml的公共电子文档.它将各类采用xml技术的数据描述文件组织起来,并提供特定的访问控制接口.主要包括版面数据(字符、图表、多媒体对象等),版式描述信息(版面样式的原味再现),版面对象的结构化信息(适合不同屏幕尺寸的流式自适应),脚本描述信息(增强CEBX的动态交互特性),安全描述信息(对于本地安全以及DRM安全的支持).
本系统对上述文档都提供了高效能的处理.
本系统处理文档格式的方式方法
本系统在基础资源数据库之上,搭建一个面向作者和编辑的内容生产、加工系统,并为作者和编辑提供强大易用的智能客户端.通过此系统,作者和编辑按照各自的权限远程参与撰写、编辑新的产品,并根据需要,对历史资源进行加工完善.当数据内容通过协同编纂达到我们的要求后,就可以根据需要,加载不同的样式,完成发布.在整个过程中,包括了数据采集、数据处理、数据发布三个环节.
一、数据采集
1.txt格式
该阶段对于txt格式的支持主要在于早期受计算机技术及存储技术所限(三寸盘为当时主要外部存储介质),txt格式的应用与保存比较普遍,部分将成为现阶段的原始数据.例如:我们需要用到2000年某书的内容,而当时仅保存了txt文档.
另一种情况是某些软件不支持样式文件的导出或者导出的文件格式并不被系统所接受,往往也会采用txt文件.例如:我们要使用到QuarkXPress排版文档的部分内容,就可能会采用从中导出txt文档的方式.
2.doc/docx格式
doc/docx格式是目前作者使用最为普遍的格式,同时系统的客户端采用的也是word+插件的方式,无论对于全新撰文还是已有word文档的引用,都提供了有效的支持.例如:作者按照出版社要求在客户端完成写作或者作者将已经完成的word文档向出版社投稿等等,所以doc/docx将会是目前导入阶段最常采用的格式.
3.fbd格式
长期以来,出版业内的排版工作绝大部分采用的是方正书版软件,对fbd格式的导入支持,在历史资源的入库以及重用过程中,都将起到不可或缺的重要作用.例如:我们要将某期刊10年来的书版完稿文件中的试题入库,或者我们要对某出版物(已有书版完稿文件)进行改版.
4.xml格式
xml是W3C组织制定的标准,xml的简单规范使其易于在任何应用程序中读写数据,虽然不同的应用软件也支持其它的数据交换格式,但他们都逐渐开始支持xml,这使xml正渐渐成为数据交换的唯一公共语言.系统自然也需要提供对其的导入支持.例如,从国外某出版社引进某出版物,对方提供的电子文档就极有可能会是xml格式的.
5.html格式
html是互联网上应用最为广泛的文档格式,对它的导入支持,主要目的是对于网页文件内容的引用.
二、数据处理
1.xml格式
根据xml格式的特性,哪怕是不同的平台、系统、软件,都很容易分析加载以及输出xml数据格式,它在数据存储、交换、共享以及结构化、重组、扩展等等方面都拥有充分的优势.所以,系统采用xml格式存储数据并作为数据源.
2.docx格式
word格式是作者与编辑最常用的文档形式,符合日常的操作习惯,所以系统采用word+插件形式的智能客户端,在协同编纂过程中,采用docx格式.
3.pdf格式
系统流程的一个重要特点是内容和样式分离,根据需要灵活加载样式可以展现不同的发布效果.但在出版业务流程的实际操作中,有些环节需要我们结合内容与样式看效果,比如我们需要审阅某出版物应用了特定版样设计是否美观.这个时候,我们就可以利用pdf格式忠实展现版面的这一特点,临时将内容和样式进行结合,通过pdf格式预览效果.
数据发布
1.txt格式
txt容量小,兼容性好,现阶段仍然是电子书、电子文档的主流格式之一.例如:目前的大量电子书网站,都是采用的txt格式.同时,txt格式作为最普遍的格式流传下来,因此现在的移动设备基本上都提供txt格式支持,而txt也因为仅仅是文字信息,所以能很好的适应移动设备的屏幕太小,进行流式阅读.
2.htmI格式
发布成html,主要为满足互联网的 应用.例如:发布引擎根据网站端的发出的要求,调用资源库内容,在网站端生成满足一定条件和展现形式的html.
3.xmI格式
xml的特点使其逐渐成为数据交换的公共语言,发布成xml,可以满足不同平台、不同系统、不同应用程序件的数据交换.比如:pc上的xml数据,我们完全可以拿到mac机上应用.
4.wml格式
发布成wml主要用于移动设备,例如:创建可显示在WAP浏览器中的页面.
5.ffx格式
发布成ffx,满足专业设计排版输出的需求.比如:我们可以发布ffx文件,并进行打包预检,然后送输出中心出菲林.
6.pdf格式
发布成pdf格式,其一是可以作为电子书,展现的效果和传统纸质书接近,包含“页”的概念,再现了生动丰富的样式,其主要缺陷在于,不能自动适应屏幕大小,很难在各类移动设备上方便阅读.
发布成pdf格式的另一个重要作用是,它能满足纸质书出版的需求.无论是传统印刷还是数码印刷,无论是输出菲林还是直接制版印刷,Adobe公司都以PDF文件技术为核心,提供了完善的解决方案.它跨平台的兼容性,它对色彩、字符、版本等的支持,它对“页”的精确直观展现等等优点,使pdf格式在出版业中被广泛应用.
pdf格式还支持网络端的浏览下载,我们在终端安装pdf插件,就能很方便通过浏览器打开pdf文档.
7.cebx格式
cebx格式,是由方正集团旗下方正技术研究院数字出版分院负责研发,目标是建立一种可靠且便易的电子文档规范.它支持“版式”阅读,提供类似pdf格式的原版原式的文档呈现方式.同时,它包含了版面的结构化信息,所以可以实现版面内容的重排,获取更好的屏幕自适应特性.这种带样式的“流式”阅读,目前还存在一定的技术难点,期待完美的显示效果.
结语
本系统通过以上流程环节对数据格式的处理应用,特别是通过xml核心技术的运用,使得原来松散的、多元的、错误的数据变得集中、统一、准确,形成数字出版的集中内容资源库,便于业务高效运作与管理. 同时,本系统通过实现内容和样式的分离,对内容采用结构化的存储和处理方式,根据需要拆分成不同的组成部分并添加标引信息;样式则一次设计、多次利用,彻底节省了出版物的排版工作量.最终通过动态出版技术,实现针对不同读者的动态内容拼装,灵活快速地组装成对应各种媒体的不同出版物.
伴随着计算机技术、通讯技术、网络技术、存储技术等的进一步发展,基于内容对象的协同编纂与动态发布系统必然会涉及和应用到更多的文档格式,我们将不断学习探讨,发现和完善其运用,为数字出版领域更好地服务.
(本文作者尚有:张世军、周怡、张莹莹、章琢之,由吴弃疾执笔
作者单位:上海世纪出版股份有限公司)
总结:本文关于格式支持论文范文,可以做为相关论文参考文献,与写作提纲思路参考。
kindle支持的格式引用文献:
[1] 什么软件支持pdf格式查重
[2] 知网查重支持什么格式
[3] 支持向量机论文范文 关于支持向量机方面毕业论文格式模板范文2500字