科技期刊出版过程的数字技术应用

科技期刊出版过程的数字技术应用

摘要:伴随数字技术的发展,科技期刊出版过程变得日益数字化、可控化,XML技术及大数据技术的应用价值正在逐步凸显,并在一定程度上影响着出版行业的生产流程、附加价值甚至组织决策。为了论证特定数字技术对科技期刊发展的重要性,以及现有科学技术发展条件下,相关技术应用开展的可能性。本文结合武汉大学科技期刊中心的数字化工作实践,探讨科技期刊出版过程中XML技术及大数据技术的应用场景及现实意义,以期为相关期刊出版单位提供一定借鉴。

关键词:数字出版;XML技术;大数据

《中国科技期刊卓越行动计划实施方案(2019-2023年)》提出将支持建设国际化数字出版平台,“抓住数字化、智能化促进期刊出版变革的重大机遇”[1],”以数字化重构出版流程,推动融合发展”[2]。在上述背景下,许多高校期刊以服务国家科技创新与学校“双一流”建设为己任,立足高校、服务全国、面向世界,致力创建高水平期刊集群,通过积极运用数字媒体新技术,在高校科技期刊行业中,树立全媒体出版、数字出版、集群化建设等方面的应用示范,进而起到引领作用,为培育世界一流科技期刊和世界一流大学的历史任务做出贡献[3]。包括武汉大学科技期刊中心(简称“中心”)在内的多家科技出版单位也在不断尝试新的数字媒体技术以促进期刊数字转型,升级发展。考虑到数字技术的范围十分广泛,本文只就目前对期刊影响较大的两项技术展开讨论,即XML技术与大数据技术。随着科技的发展,当前的XML技术已从单纯对已进行结构化处理,转变为在排版过程中即开始XML元数据的解析。在集成的平台中,图片、文字、表格,甚至是标题、作者、基金、关键词、摘要等信息都被有序的存储在相应位置,等待随时搜索、调配、整合。而在大数据背景下,信息量巨大而知识量小[4],获取切实有用的数据信息变得尤为重要。数据即价值,用户访问网站会留下数据,投递稿件会留下信息,每一次的交互或者关联都存在潜在的价值。武汉大学科技期刊中心近几年主动尝试将XML结构化技术应用于生产过程并积极尝试提升论文衍生价值,同时,应用方正学术出版云服务平台的大数据分析能力对期刊传播效果进行提升,希望利用数字技术将中心期刊出版过程全面优化、升级。

一、相关技术应用的现实意义

1.提升学术传播力和品牌影响力。当前,在维护我国学术成果自主权和信息安全的前提下,逐步改变“借船出海”的现状,探索“造船出海”的路径,突破中文学术期刊国际影响力提升的瓶颈。践行“互联网+期刊”的思维举措[5],提升学术论文的传播能力,实现一次生产,多平台传播,精准推送,准确洞察作者、读者、专家的需求后做好定向服务,最终提升学术期刊的品牌影响力。

2.探索全媒体出版模式。武汉大学科技期刊中心通过使用XML技术与大数据技术,灵活运用多种内容展现形式进行发行和传播,实现媒体之间的边界消融,促进内容资源的增值、增效,逐步推进全媒体出版的进程。例如,通过移动端和Web端的同步出版,实现多渠道的内容传播;借助移动端传播的优势,推进富媒体内容、科研数据等多种出版形式的内容传播,满足读者对于碎片化、知识化等方面的阅读需求。结合大数据的分析结果,特定的学术内容被推给特定的受众,根据科学的数据算法与统计,按需出版、定制出版都将指日可待。

3.推进出版流程全面数字化,提升作者服务能力。国外期刊出版在生产方面,已经实现全面数字化,并普遍采取基于XML的集约化生产模式。大型出版集团内部采取统一的数据标准和生产方式,实现数据的有效联通。通过整合加工多种类型数据资源,能极大地丰富出版物的出版形态。在内容审校环节,国外的出版机构将刊物以集群形式进行划分,优质稿件在集群内部通畅流转,刊社内部也采取严格的同行评议制度,保证效率的同时保证质量[6]。在国内,传统的期刊社办刊模式使得编辑只负责一本期刊的内容。刊物之间并没有形成联动机制,优质稿件无法在刊物之间无缝流转。武汉大学科技期刊中心,在已有数字出版流程重塑的基础上,进一步推进基于移动互联网的在线协同办公,完善在约稿、投审稿、排版生产等环节中的交互能力,在提升出版效率的同时,增强出版单位的作者服务能力。

4.集群化建设,以适应统一管理需求。国外期刊在集群化、集约化方面,呈现出规模化、集群化、体系化、商业化发展趋势[7]。通过发挥刊群优势,聚焦纵深行业,形成了品牌化和国际化的垄断形势。我国科技期刊在刊群建设和集群化运营方面,受到组织机制等方面的影响,运作方式没有发挥出最大效益。武汉大学科技期刊中心尝试利用方正学术出版云服务平台,在现有集群组织机构整合、集约化数字出版流程重塑的基础上,进一步利用XML技术与大数据技术优势,实现精细化、碎片化的集群出版资源整合和过程管控。

二、XML结构化技术应用的新型出版场景

1.内容生产环节:一次加工,多元基于XML数据的结构化排版,实现了期刊内容与样式的分离,使得经过标引的文件或元数据形成资源储备,在独立于文件格式之下实时变更、适应不同的媒介,实时[8]。真正做到一次加工,多元、重复利用,满足数字出版和全媒体出版的需求。武大科技期刊中心利用方正学术出版云服务平台实现论文数据从排版环节即XML结构化,以期满足不同形式的出版需求。排版过程能够“所见即所得”,排版结果能够即时生成多种文件格式:高精度的PDF文件可直接交付印刷厂印刷,完成传统的纸质出版;平台同步输出的XML文件可与PUBMED、EI、MEDLINE、IEEE等国外主流数据库平台进行数据无缝对接;含元数据的全文XML可以满足刊社未来的数据运营及内容策划,可满足刊社第三方网刊需求,Rich-HTML文件可满足Web端和移动端的同步出版。

2.发行传播环节:打造生产即的快速传播模式学术出版领域,论文的快速发表、广泛传播、被引率是确定一篇优秀论文首发权以及各国争夺学术话语权的重要衡量指标。基于XML数据的生产平台,能够同传播平台进行紧密衔接,当一篇优秀稿件达到优先出版的条件,便可以通过平台提供的一键能力快速发表,抢占论文首发权。这一“生产即”的模式,完全改变了传统出版先有纸刊再数字化的模式,为学术成果的快速传播提供了技术保障。随着技术服务商政策与技术的发展,武汉大学科技期刊中心为提高论文的传播效率和利用价值,先后采用优先出版和网络首发的出版模式。节省了版面等待、印刷邮发时间,研究成果发表周期加快。中心目前有5刊正在使用方正学术出版云服务平台,经过1-2期的试用,在较为熟悉新排版技术手段的基础上,期刊单篇优先出版效率确有提升。

3.过程管理环节:可追溯生产过程的全周期管理作为集群化管理的期刊出版服务机构———武汉大学科技期刊中心希望能够从更为规范、可控的角度对旗下各刊工作进行协调与推进。因此通过使用基于XML排版的方正学术出版云服务平台,对所有学术文献的生产过程进行记录,可以确保每一篇稿件的生产过程版本、校次、操作记录均可追溯,支持按照不同角色对稿件进行流转,严格控制生产过程及权限节点,保证生产过程安全高效。

4.增值产品开发环节:数据衍生的增值能力基于XML技术的论文数据从生产过程中就被结构化解析,并按需存储在方正学术出版云服务平台后台,资源中心模块提供各种维度的内容汇编、重组能力,为专业知识库产品策划提供内容聚合,编辑可以对论文、图片、表格等内容资源进行多字段检索,包括论文标题、作者、作者单位、基金、关键词、摘要、图题标题等多字段,基于新的内容管理与组织方式进行重新整理,形成虚拟专辑,定制专辑。基于多维度的数据统计能够为运营提供良好支撑;高级学术检索能力,还可以满足专业编辑对论文资源进行专业检索的需求,可以实现多字段、逻辑关系等多维度的资源检索。可以帮助刊社实现传统的单篇优先出版、整期出版,同时提供图表、音视频、科研数据等富媒体增强出版能力,实现数据融媒体出版。

三、大数据技术应用的新型出版场景

1.内容生产环节:了解自身定位,预测发文热点利用大数据及其分析手段,能够帮助期刊出版单位了解自身定位、读者情况、行业概况。武汉大学科技期刊中心借助方正学术云出版服务平台中的大数据工具,对文献、引证、读者活跃度进行分析,推荐精准作者、读者;借助领域分析工具,获得行业刊物的领域知识图谱和肖像刻画,对学术热点进行分析和追踪对发展趋势进行预测。

2.发行传播环节:精准分析,定向推送基于大数据分析技术,期刊可以运用学者图谱工具,绘制人物关系图谱、刻画学者肖像,实现审稿专家的精准推荐;借助精准推送工具触达多维度的读者、传播多类型的内容、获取多指标的传播分析,改变传统的“人找信息”的内容获取方式,转化为“信息找人”的主动传播模式,通过强大的内容推荐引擎,通过对作者、科研工作者、学者等的肖像刻画,为他们推送更新、更贴近他们需求的学术资源和文献。中心旗下两刊《武汉大学学报·信息科学版》及《测绘地理信息》分别使用了几期基于大数据分析的精准推送功能。从反馈报告可以看出通过大数据技术实现的精准推送所能获得的反馈信息远远大于传统方式,传播路径分析能够解析出点开邮件用户的所属位置,能够有效获知对自己期刊内容感兴趣人员的分布位置;打开及点击情况统计能够获知整体的推送效果,并据此调整下次推送时间、形式等细节,以获得更好效果;文章点击量排行能够知道在这一期推送内容中最受潜在作者关注的是哪一方向的文章,能够对后期组约稿提供指导。精准推送反馈报告,见图2。

作者:高映月 黄? 单位:武汉大学科技期刊中心