DITA 是面向主題的文檔類型定義規范,是針對結構化數字出版內容拆分與重組需求而設計的技術標準。DITA 在XML 基礎上拓展了面向數字出版物描述的各項元素,覆蓋數字出版物信息組織、編寫、生成和交付等各個流程,并允許使用者根據不同領域技術出版物的需求進行擴展和定制。DITA的使用能夠有效減少數字化出版過程中的信息冗余,為內容深加工和多渠道發布提供新的模式。
本書圍繞 DITA 標準展開,詳細介紹了DITA 標準的設計思想和體系架構,并從多個層面對DITA 標準的基礎內容進行梳理和介紹,同時對DITA 標準的重點內容如主題、映射、領域專門化和樣式渲染等內容進行詳細分析,引導讀者深入了解DITA 標準的各項細節。
本書還結合國家標準規范、詞典辭書等有針對性的典型應用分析,配合 DITA 的行業應用實例,幫助數字出版從業者了解DITA 的出版流程和應用領域,讓更多的數字出版從業者了解DITA、深入DITA,并靈活使用DITA 來編排創作各類數字出版物。
第1章 Chapter
DITA概述
1.1 DITA數字出版技術
1.1.1 DITA標準概述
1.1.2 DITA發展歷史
1.1.3 DITA技術委員會
1.1.4 DITA應用領域
1.1.5 DITA背景知識
1.2 OASIS(結構化信息標準促進組織)
1.2.1 OASIS簡介
1.2.2 OASIS發展歷史
1.2.3 OASIS技術委員會
第2章 Chapter
DITA出版流程與技術架構
2.1 DITA出版流程
第1章 Chapter
DITA概述
1.1 DITA數字出版技術
1.1.1 DITA標準概述
1.1.2 DITA發展歷史
1.1.3 DITA技術委員會
1.1.4 DITA應用領域
1.1.5 DITA背景知識
1.2 OASIS(結構化信息標準促進組織)
1.2.1 OASIS簡介
1.2.2 OASIS發展歷史
1.2.3 OASIS技術委員會
第2章 Chapter
DITA出版流程與技術架構
2.1 DITA出版流程
2.2 DITA架構分析
2.2.1 理解DITA主題
2.2.2 理解DITA映射
2.2.3 DITA領域專門化
2.2.4 DITA樣式渲染
2.3 數字出版標準對比分析
2.3.1 DocBook
2.3.2 S1000D
2.3.3 NewsML
2.3.4 OXML
2.3.5 ODF
2.3.6 ePub
2.3.7 CEBX
2.3.8 OFD
2.3.9 TeX
2.3.10 常見數字出版標準的對比
第3章 Chapter
DITA主題
3.1 DITA主題概述
3.1.1 主題的作用
3.1.2 主題寫作的優勢
3.2 DITA主題的信息類型
3.2.1 任務主題(Task Topics)
3.2.2 概念主題(Concept Topics)
3.2.3 引用主題(Reference Topics)
第4章 Chapter
DITA映射
4.1 DITA映射概述
4.1.1 DITA映射的信息組織
4.1.2 DITA映射的結構
4.2 DITA映射的元素與屬性
4.2.1 DITA映射的元素
4.2.2 DITA映射的屬性
第5章 Chapter
DITA框架
5.1 DITA框架的構成
5.1.1 DITA基礎框架
5.1.2 DITA框架實現
5.2 DITA擴展與約束
5.2.1 機制概述
5.2.2 約束機制
5.2.3 擴展機制
5.3 DITA擴展應用
5.3.1 主題專門化
5.3.2 領域專門化
第6章 Chapter
DITA支撐處理
6.1 DITA內容處理
6.1.1 內容導航
6.1.2 內容鏈接
6.1.3 內容定位
6.1.4 內容包含
6.1.5 內容過濾
6.2 DITA條件處理
6.2.1 DITA條件處理的作用
6.2.2 DITA條件處理示例
6.3 已有內容向DITA轉換
6.3.1 轉換目標
6.3.2 轉換過程
6.3.3 已有文檔向DITA的轉換步驟
第7章 Chapter
DITA支撐工具
7.1 DITA支撐技術
7.1.1 可擴展標記語言
7.1.2 內容驗證
7.1.3 版式渲染
7.1.4 相關知識
7.2 DITA Open Toolkit開放工具箱
7.2.1 DITA開放工具箱概述
7.2.2 DITA開放工具箱構成
7.2.3 DITA開放工具包處理過程
7.2.4 DITA OT中文支持
7.3 DITA工具與產品
7.3.1 DITAworks
7.3.2 DITA Storm
7.3.3 Adobe FrameMaker
7.3.4 Arbortext Editor
7.3.5 傳知DITA工具
7.4 XML支撐工具與產品
7.4.1 MarkLogic數據庫
7.4.2 方正智睿XML數據庫
7.4.3 oXygen
7.4.4 XMLSpy
7.4.5 Serna Enterprise XML Editor
第8章 Chapter
DITA典型應用
8.1 DITA國家標準應用案例
8.1.1 國家標準
8.1.2 國家標準內容分解原則
8.1.3 國家標準封面分析
8.1.4 國家標準正文分析
8.1.5 國家標準內容重組
8.2 DITA辭書應用案例
8.2.1 詞典的DITA主題描述
8.2.2 基于DITA重組的按需出版
第9章 Chapter
DITA數字出版技術總結
附錄
附錄A DITA標準規范
A.1 架構規范:基礎內容
A.2 架構規范:技術內容版本
A.3 DITA版本更新信息
附錄B 主要國際標準化組織
B.1 各國標準化組織
B.2 ISO認可的國際標準組織
B.3 標準化專業術語中英文一覽表
附錄C 國際標準化活動參與方式
C.1 參與國際標準化活動的主要方式
C.2 獲取國際標準化活動信息的主要渠道
C.3 跟蹤國際標準化活動的方法
C.4 標準信息查詢途徑和流程
附錄D 國際標準化組織(ISO)
D.1 ISO基本情況
D.2 ISO研究領域
D.3 ISO相關程序
D.4 ISO成員
附錄E 結構化信息標準促進組織(OASIS)
E.1 OASIS基本情況
E.2 OASIS研究領域
E.3 OASIS相關程序
E.4 如何加入OASIS
E.5 OASIS在中國
E.6 OASIS技術委員會名單
附錄F 萬維網聯盟(W3C)
F.1 W3C基本情況
F.2 W3C研究領域
F.3 如何加入W3C
F.4 W3C在中國
F.5 W3C工作組名單
參考文獻
序言
數字出版方興未艾。作為新聞出版業的重要發展方向和戰略性新興產業,數字出版近年來發展迅速,已經成為當前我國新聞出版業轉型發展的助推器和新的經濟增長點;诨ヂ摼W、移動通信網、有線電視網、衛星直投等傳播渠道,并以PC 機、平板電腦、智能手機、電視、iPad等閱讀終端為接收載體的全新數字出版讀物,已成為人民群眾精神文化生活不可或缺的組成部分。
從畢升的活字印刷到王選的激光照排系統問世,技術元素始終是出版業發展壯大的重要源動力。進入21 世紀,信息通信技術(ICT)的飛速發展成為新經濟發展的主要引擎,使得以思想傳播、知識普及、文化傳承、科學交流和信息發布為主要功能的出版業可以持續、廣泛地提升其影響力,同時大大地縮短了信息交流的時滯,拓展了人類交流的空間。計算機芯片技術、XML 及相關標記語言技術、元數據技術、語義技術、語音識別和合成技術、移動互聯技術、網絡通信技術、云計算技術、數字排版及印刷技術、多媒體技術、數字權利管理技術等一大批數字技術的廣泛應用,不但提升了傳統出版產業的技術應用水平,同時極大地擴展了新聞出版的產業邊界。
如同傳統出版業促進了信息、文化交流和科技發展一樣,數字出版的多業態發展也為20 世紀末期開始的信息爆炸轉變為滿足個性化需求的知識文化服務提供了技術上的可能。1971 年,聯合國教科文組織(UNESCO)和國際科學聯盟理事會(ICSU)便提出了UNISIST 科學交流模型,將出版業所代表的正式交流渠道置于現代科學交流體系的中心位置。進入21世紀,理論界又預見到,網絡出版等數字出版新業態的出現正在模糊正式交流和非正式交流的界限,更可能導致非正式交流渠道地位的提升。
隨著以讀者(網絡用戶)為中心的信息交流模式,比如博客、微博、微信和即時通信工具等新型數字出版形態的不斷涌現,理論構想正在逐漸變為現實。
通過不斷應用新技術,數字出版具備了與傳統出版不同的產品形式和組織特征。由于數字出版載體的不斷豐富、信息的組織形式多樣化以及由于網絡帶來的不受時空限制的傳播空間的迅速擴展,使得數字出版正在成為出版業的方向和未來。包括手機彩鈴、手機游戲、網絡游戲、網絡期刊、電子書、數字報紙、在線音樂、網絡動漫、互聯網廣告等在內的數字出版新業態不斷涌現,產業規模不斷擴大。據統計,在2006年,我國廣義的數字出版產業整體收入僅為260 億元,而到了2012 年我國數字出版產業總收入已高達1935.49 億元,其中,位居前三位的互聯網廣告、網絡游戲、手機出版,總產出達1800 億元。而與傳統出版緊密相關的其他數字出版業務收入也達到130 億元,增長速度驚人,發展勢頭強勁。
黨的十七屆六中全會為建設新時期的社會主義先進文化做出戰略部署,明確要求發展健康向上的網絡文化、構建現代傳播體系并積極推進文化科技創新,將推動數字出版確定為國家戰略,為數字出版產業的大發展開創了廣闊的前景。作為我國圖書出版產業的領軍者之一,電子工業出版社依托近年來實施的一批數字出版項目及多年從事ICT 領域出版所積累的專家和學術資源,策劃出版了這套“數字出版理論、技術和實踐”系列圖書。該系列圖書集中關注和研究了數字出版的基礎理論、技術條件、實踐應用和政策環境,認真總結了我國近年發展數字出版產業的成功經驗,對數字出版產業的未來發展進行了前瞻性研究,為我國加快數字出版產業發展提供了理論支持和技術支撐。該系列圖書的編輯出版適逢其時,順應了產業的發展,滿足了行業的需求。
毋庸諱言,“數字出版理論、技術和實踐”系列圖書的編寫,在材料選取,國內外研究成果綜合分析等方面肯定會存在不足,出版者在圖書出版過程中的組織工作亦可更加完美。但瑕不掩瑜,“數字出版理論、技
術和實踐”系列圖書的出版為進一步推動我國數字出版理論研究,為各界進一步關注和探索數字出版產業的發展,提供了經驗借鑒。期望新聞出版全行業以“數字出版理論、技術和實踐”系列圖書的出版為契機,更多地關注數字出版理論研究,加強數字出版技術推廣,投身數字出版應用實踐。通過全社會的努力,共同推動我國數字出版產業邁上新臺階。
前言
在《中共中央關于深化文化體制改革、推動社會主義文化大發展大繁榮若干重大問題的決定》、《文化產業振興規劃》、《國家“十二五”時期文化改革發展規劃綱要》、《新聞出版業“十二五”時期發展規劃》和《數字出版“十二五”時期發展規劃》等黨和國家的一系列重要文件中,頻繁出現“數字出版”或“數字出版產業”這一概念。這表明發展包括“數字出版”和“數字出版產業”在內的文化產業,已上升為我國重要的國家戰略。
數字內容出版作為一種新興的出版業態,隨著互聯網和移動通信的發展而逐步普及到多種閱讀終端。目前,隨著展示終端的日益豐富、技術的不斷革新和產業服務鏈的日趨完善,數字出版物已逐漸成為出版業界新的增長點,得到出版從業人員和相關研究機構的廣泛關注和積極參與。
目前傳統出版業正在向綜合運用文、圖、聲、光、電等多種表現形式的全媒體數字內容出版發展過渡。這種新的模式通過文字、圖形圖像、聲音、網絡和通信等多種媒介形式或傳播手段的綜合運用,借助紙質出版物、互聯網、手機、手持閱讀器及電影屏幕等多種展現方式,將出版內容經由多種渠道全方位地向閱讀者展示,這種數字化內容同步出版的方式能夠在第一時間最大限度地覆蓋所有潛在的閱讀群體。
數字內容出版模式從資源整合的角度出發,以內容生產為核心,對傳統出版物進行數字化升級。從單終端、單形態和單一走向的出版模式轉換到多終端、多形態和多渠道發布的數字內容出版模式。實現出版物的一次制作與多渠道多層次的內容發布,使任何人在任何時間、任何地點以多種方式獲得可閱讀的出版內容,并讓讀者獲得更為豐富的閱讀體驗。
數字出版時代的內容需求者不再滿足于被動地接收信息,而是希望通過更為靈活自主的方式來選擇數字信息內容及獲取方式。正如讀者僅僅想獲取出版物中按照特定主題分類聚合形成的內容,類似于書籍中按照某一關鍵詞檢索后形成的語義完整的內容。然而,在現行出版模式下,內容需求者只能選擇將包含某一章節或所需內容的書籍進行整體購買,然后從中抽取自己希望了解的內容進行閱讀、學習。如何滿足這樣的個性化出版需求,成為數字出版過程中亟待解決的問題,特別是在門類眾多的教育類出版物、自然科學出版物和技術類出版物等領域,這一需求的體現尤為強烈。
然而,在編輯出版過程中,出版物常用的內容編輯格式通常是以二進制形式存儲的商用版式或流式文件標準,這種文檔格式在數字內容出版的應用中存在著很多不足之處,如:不便于出版內容的分解、不便于出版內容的重用、不便于出版內容的多形式展現、不便于內容的跨平臺發布、不便于內容的深度挖掘,等等。然而面對數字內容出版的變革,傳統的內容組織與發布形式已不能適應新形勢下的出版業態,數字出版的發展需要引入新的內容組織方式和技術標準。
DITA(達爾文信息分類體系架構)就是針對結構化數字出版內容拆分與重組需求而設計的技術標準,DITA的使用能夠有效減少數字化出版過程中的信息冗余,為內容深加工和多渠道發布提供了嶄新的模式。
本書的內容將圍繞DITA標準展開,介紹DITA標準的設計思想和體系架構。本書將從多個層面對DITA標準的基礎內容進行梳理和介紹,并對DITA標準中主題、映射、領域專門化和樣式渲染等內容進行詳細分析,引導讀者深入了解DITA標準的各項細節。本書還將結合有針對性的典型應用分析,配合DITA的行業應用實例,幫助數字出版從業者了解DITA的出版流程和應用領域,讓更多的數字出版從業者了解DITA、深入DITA,靈活使用DITA來編排和創作各類數字出版物。
當然,通過較短時間的閱讀來了解DITA的使用和細節并非易事,僅當前版本(1.2版本)的DITA標準就包含了具有特定屬性的400多項元素,雖稱不上體系龐大,但初看也是紛繁復雜。然而更為關鍵的一點是,從語義上學習并理解DITA標準中拓展定義的各類XML標簽及其內容分類并不難,真正的挑戰在于怎樣運用好DITA元素、DITA主題類型和DITA映射來滿足在寫作中的內容組織以及如何處理好各類出版物的編輯需求。
正如筆者在了解并深入DITA過程中遇到的障礙和收獲的經驗一樣,本書所涵蓋的內容同樣考慮到了閱讀者的學習需求和可能存在的顧慮,因此,在闡述DITA設計思想和使用原理的基礎上,涵蓋了運用DITA進行編輯出版過程中最為常用的環節,而不拘泥于DITA各要素定義中面面俱到的細枝末節,通過實例幫助讀者了解DITA常見要素的描述說明和使用方法,幫助讀者觸類旁通地掌握自己在今后深入使用DITA時所應具備的相關知識。
本書的讀者對象定位于準備了解并使用DITA的用戶,包括內容編輯工作者、數字出版從業者、技術產品制造和高端裝備制造業的技術人員及IT公司的技術人員等。同時,本書也非常適合作為高等院校新聞出版專業和信息技術專業的教材。
在本書的寫作過程中,筆者針對目前穩定且通用的DITA 1.2版本進行講解,為使本書在出版后的一段時間內具備更好的時效性,在涉及應用和示例的章節,為方便讀者獲取并使用,筆者盡量使用免費且開放源代碼的DITA Open Toolkit(DITA開放工具箱)完成編譯出版的示例。當然,并不是所有的DITA用戶都喜歡用命令行編譯方式來完成操作,因此,筆者還介紹了一些能夠實現所見即所得的DITA商用軟件,來豐富讀者在DITA創作工具方面的選擇。
值得一提的是,作為一項擁有廣泛用戶基礎的開放標準,DITA正在逐步形成一些活躍且極具凝聚力的用戶群組或社區,如DITA用戶組論壇(http://groups.yahoo.com/group/dita-users/),上面常常會出現關于DITA在特定業務領域應用的討論,對于希望對DITA進行深度定制應用的讀者來說,這樣的用戶社區值得關注。此外,DITA的官方WiKi站點(http://wiki.oasis-open.org/dit