添加收藏
微信分享
微博分享
选题精准、内容智能、编排高效,新闻领域的大数据应用
摘要

大数据技术为内容生产提供了丰富素材和数据分析支撑,促进了内容生产环节的视觉化、自动化、定制化和模式化发展。

(来源:出版发行研究 作者:张博 雷锦 楼文高 原标题:新闻出版领域大数据应用模式研究)

编者按:随着大数据技术在各行各业的应用推广,基于数据的应用创新不断涌现,商业形式不断丰富。本文基于出版流程的五大基本环节,提出大数据在出版产业的应用模式,包括选题策划的精准化、内容生产的智能化、编排制作的高效化、出版物营销推广的最优化和市场服务的增值化,为推动出版产业升级和价值链重构提供参考依据。

1 综述

关于大数据在出版领域的应用研究,许多研究者从不同的视角进行了阐述。从出版产业转型角度出发,吴赟分析了大数据对整个出版产业体系重构所产生的影响,就出版业应如何应对大数据以及在大数据实施过程中需要注意的关键问题做出了思考[1]。张弛从大数据时代出版的三个维度:出版价值链维度、出版供需链维度和出版空间链维度深入分析了大数据对整个出版产业链重构所起到的作用[2]。向安玲对基于大数据的出版流程变革进行了分析,并构建了基于流程变革的“5P”模型[3]。李兵和漆咏德认为,数字化时代出版企业必须利用大数据技术从延伸价值链和缩短供应链两个角度构完成出版商业模式的转型[4]。

从大数据在出版领域的应用前景出发,刘立玲和张群力认为在大数据的驱动下出版商将由内容提供商逐渐向综合信息服务商转型,内容产业的商业模式将向网络经济靠拢[5]。张新新指出大数据在新闻出版行业的应用价值在于数据挖掘,大数据将在构建出数据价值体系后重塑新闻出版数据的采集、存储、标引、计算、建模和服务[6]。刘鲲翔等人从大数据技术在数字出版领域中的前景出发,认为未来数字出版必将是以数据驱动的云出版,大数据在出版物的策划营销、研发生产以及用户体验、效果评估等各方面都有积极作用[7]。

从大数据技术在出版领域的具体应用方面出发,张秋瑰研究了大数据技术在出版营销中的应用,她认为大数据技术可帮助出版商在营销过程中匹配信息、修正偏差并可以将数据包装成产品[8]。张博和任殿顺指出了大数据背景下的UGC(用户生产内容)在用户和内容两方面的价值并就如何挖掘其价值进行了探索[9]。资武成和方卿从出版企业IP运营的角度探索大数据在出版运营过程中的应用案例和创新的具体策略[10]。张炯研究了大数据背景下的三种新型出版模式,即众包模式下的故事创作与出版、预测语义与精准推送的按需出版、基于开放数据的可视化互动出版[11]。

可以看出,以往的研究主要集中在宏观视角下大数据引起的出版产业转型、大数据在出版领域应用的前景设想及大数据技术的具体应用方式探索等方面,较少关注出版大数据的具体应用模式。本文将基于典型企业案例,结合出版流程中的基本环节构建出版大数据的应用模式。

2 选题策划环节的大数据应用模式

在选题策划环节,出版社可通过大数据分析提升选题策划活动对市场需求的命中率。以下从选题方式出发,基于“数据获取方式+数据类型”的角度总结选题策划方面的大数据应用模式。

2.1 跨界合作式选题:“协议共享+电商大数据”模式

传统出版社在选题策划领域经验丰富,却缺乏可用于进行选题分析的读者数据。与之相反,电商渠道作为当前出版物最重要的分销渠道之一,坐拥海量用户行为数据,却缺乏图书选题经验。因此,出版企业可以与电商在合作过程中基于协议共享用户数据,通过优势互补推进选题的精准化。

新世界出版社与各大电商平台基于大数据的选题合作屡获成功。2014年新世界与京东合作,通过对1700万用户搜索、浏览以及购买频次等行为数据进行分析,合作策划了我国首部大数据选题图书《大卫·贝克汉姆》,这本书迅速登上当月畅销榜并赢得不错口碑[12]。2016年,新世界与当当网展开合作,借助大数据分析策划了童书《写给儿童的中国地理》,短短3周卖出11万册。

2.2 平台聚合式选题:“自建社交平台+用户行为数据”选题模式

数据获取是当前传统出版社应用大数据的瓶颈,出版社为系列图书自建社交平台可持续获取活性强、新鲜度高的数据,通过读者和市场的实时反馈制定选题,有利于图书策划运营活动的持续创新。

例如,学乐出版社为旗下《39条线索》系列丛书搭建读者交流平台来收集用户行为数据,通过筛选自建网站中热度高、处于上行趋势的话题作为系列丛书中下一部出版物的主题。目前此系列已经推出了10本书、350多张收集卡以及一个在线游戏,拥有1500万的纸质书销售量,近200万的儿童注册了《39条线索》的网站(网站每天增加1200位的注册用户)[13]。

2.3 数据仓库式选题:“数据采集站+行业情报数据”模式

传统出版中选题信息的采集依赖于编辑的信息搜集和经验判断,充斥着诸多不确定性。大数据时代,选题策划从完全的经验决策模式逐步趋向数据与经验结合判断模式。通过抓取当前市场的热门图书销售信息,可监测出版物市场的变化趋势,为编辑提供更多参考信息。

美国的Callisto传媒公司就利用行业情报积极开拓小众市场,该公司每月收集6千万条读者数据,并挖掘用户搜索行为中的小众出版物空白点,随后利用大数据分析结果拟定选题和出版物大纲。Callisto聘请的作者根据数据分析结论进行写作,从发现选题到新书上市,一般在9周内完成。

2.4 内部共享式选题:“信息交换平台+出版物市场信息数据”模式

传统出版长期存在出版物信息不对称,市场信息缺乏,选题跟风等问题,造成图书滞销和库存积压。大数据背景下,专业编辑依托出版物信息交换平台可以有效结合编辑经验和大数据集成分析优势,兼顾选题质量和效率。

中国少年儿童新闻出版总社建立“图书选题策划系统”,为内部编辑策划人员提供完整的出版物市场信息,包括现存的少儿图书书目、选题分布、选题趋势分析、少儿图书销售排行榜、选题评价、专业机构分析以及读者(儿童读者、家长、教师)的反馈等。该系统的应用为编辑策划人员提供多维度、多板块、实时数据采集分析服务的功能,帮助出版社及时了解自身出版产品的市场反馈,及时调整出版规划。此外,新经典文化开发了"私有云"平台,接力出版社也通过开发“中国儿童分级阅读大数据采集系统”,实现出版公司内部垂直化的市场信息共享。

3 内容生产环节的大数据应用模式

大数据技术为内容生产提供了丰富素材和数据分析支撑,促进了内容生产环节的视觉化、自动化、定制化和模式化发展。

3.1 视觉化生产(Visualization):“可视化工具+事实数据”模式

可视化的内容生产模式将事实数据(factual data)包装为数据新闻(data news)、信息图(infographic)、短视频等多种内容产品。这一模式可应用于新闻报道、品牌传播和知识管理等各个层面。

例如,世界杯期间彭博通讯社就专门设立了BSports团队制作了面向世界杯的预测图表,借助社交网站传播大数据信息图,有效提升了通讯社的影响力。其他典型案例还包括英国《卫报》的大数据新闻报道尝试,以及美国泰勒弗朗西斯公司的专业知识图谱服务等。

3.2 自动化生产(Automation):“人工智能+历史文本数据”模式

基于海量数据素材和机器学习算法,机器智能写作模式成为大数据时代内容生产的重要辅助手段,并且在财经、体育等高频事件中普及应用,自动生成快捷的新闻报道。

美国Narrative Science公司可通过大数据技术对某一主题进行历史文本数据分析,自动选择合适的写作角度,快速形成具有标准新闻结构的文章。Narrative Science 最初被应用在各类体育赛事中,随着语义分析和文本分析技术的成熟,又逐渐被应用在财经报道等领域。国内企业也开始了类似的尝试,腾讯开发Dreamwriter用于体育新闻报道;第一财经日报开发DT稿王用于财经新闻写作;新华社则在两会期间推出了快笔小新用于会议报道。

3.3 定制化生产(Customization):“用户画像+用户数据”模式

大数据驱动下的内容定制模式将用户需求有计划地渗透到内容产品生产的每一个方面,利用用户画像与用户数据的有机结合,在内容上全方位迎合用户,提升出版产品的市场成功率。

2013年Netflix通过分析3000万北美用户数据,打造出现象级美剧《纸牌屋》。在出版业,英国Jellybooks公司通过向读者提供免费的电子书来收集读者的阅读行为数据进行用户画像分析,通过数据了解读者阅读喜好和习惯,并将分析结果反馈给内容生产者,指导开展更具有针对性的内容创作。

3.4 模式化生产(Patterning):“智能语义分析+内容基因数据”模式

ll在内容生产领域,系列出版物往往拥有相似的结构和套路。当前,大数据分析可以通过抽取以往成功出版物的“内容基因”,帮助打造新型出版物。出版物的内容基因包括出版物的主题、情节、人物,以及风格等。

在美国《畅销书密码》一书中,作者朱迪·阿彻(Jodie Archer)和杰克斯把过去30年里出版的5000本图书输入计算机,用智能语义算法过滤出了畅销书最常见的元素和特点,通过分析畅销小说2800个元素,他们宣称预测图书是否畅销的准确率可以达到 80%。

4 编排制作环节的大数据应用模式

内容编排制作是内容包装成产品的关键一步。在这一环节,大数据带来的是生产效率的巨大提升,基于数据分析的出版工作流管理平台使编排工作不断走向标准化、集成化和协同化。

4.1 标准化制作(Standardization):“CMS+多产品输出”模式

大数据背景下,内容的编排制作呈现出更强的非线性趋势,内容经碎片化后的调用能力、重组能力成为提高编排制作效率的关键。通过大数据搭建CMS(content management system内容管理系统)可以使出版物制作流程更加标准化,从而提升内容掌控力。

出版技术服务公司Lapiz数字服务开发了一套面向中小型出版商的CMS系统,可根据不同格式或不同用途进行编排。当内容用于社会化媒体发布或门户网页发布时,则加入更多交互元素;当内容作为电子书发布时,就根据内容分发平台(如电子书商店、智能手机应用商店等)的不同要求编排内容;当内容作为实体书发布时,以适应纸质出版物的形式编排内容。类似的内容管理系统还包括TNQ公司推出的AuthorCafe 平台,经该平台进行管理、编辑的内容可生成任意一种格式。

4.2 集成化制作(Integrated):“HTML+内容自动集成”模式

出版业数据资产的构建中,源数据资源的碎片化和重新整合能力非常重要,标志着出版企业数据资源的深度开发和自由组合潜力。因此传统的PDF等版式格式不能满足内容灵活复用的需求,HTML格式在源内容编辑和发布中的地位逐渐上升。HTML格式的优越性在于其拥有丰富的语义,可涵盖图书编辑流程中的各项标引需求,还可通过与CSS的结合来构建内容模型,展现清晰的出版物章节层次和结构。

大数据背景下HTML格式和内容自动集成模块的组合提升了出版企业源内容数据资产的建设效率。印度出版科技服务公司Quick Sort India推出的QuickFlow平台就采用了这一编排模式,其内置基于HTML格式的内容创作与管理工具可帮助出版物在编辑时进行自动组合,索引和生成目录;同时内置参考文献自动构建器,对文本进行逐条和以问题为基础的整理;在内容审查过程中提供实时监控,避免重复审查,缩短生产时间,加快审查周期。

4.3 协同化制作(Synergistic):“云计算+工作流严格管理”模式

传统的出版物生产为线性模式,必须遵循严格的时间线顺序进行内容编辑和加工。基于云计算的出版协同系统使出版的编排制作环节向非线性和多线性发展。从业者可通过出版协同系统在手稿到出版物成型间的每个工作节点灵活跳跃,通过对作者的修改痕迹、编辑审读意见、出版物制作者建议等全面同步,使出版流程中各方进行充分沟通。

学术出版领域是出版业云计算工作流管理的典型试验场。出版技术服务商Newgen推出的JAWS Evolve学术出版工作流解决方案就形成了从论文初稿提交到同行评审再到期刊制作完成整个过程间的全面协同。JAWS Evolve的同行评议管理系统模块在稿件开发和审查阶段允许作者、编辑和评论者之间即时交流;通过预定义的审阅表单,电子邮件和通知简化沟通。在生产过程中编辑可对期刊,问题或文章等任何对象设置跟踪和自动提醒。

5 内容流通环节的大数据应用模式

基于大数据的内容流通,通常指基于用户的个人情况、消费习惯、阅读偏好、职业信息等数据,通过对出版产品的精确推荐达成内容消费。一般情况下,传统出版企业在内容流通环节中与大数据的结合存在以下三种模式。

5.1 分工合作:“出版社+电商企业”模式

出版企业与电商分工合作,前者提供出版内容,后者收集消费者信息,通过对消费者的行为习惯、兴趣爱好等进行数据分析,绘制用户画像,进行精准营销。

2013年海豚传媒出版公司联合当当网通过分析消费者搜索关键词、浏览记录以及用户评论,获取读者的购买需求和意愿,将美国原版作品改编成《少年励志小说馆》系列丛书推出,该书不到6个月内取得了两万套的销售佳绩。与此类似的还有青岛出版集团与京东的合作,京东为青岛出版集团的营销推广提供数据和技术分析支持,向特定消费者定制发行个性化书刊。

5.2 专业外援:“出版社+数据分析公司”模式

出版企业与专业的数据分析公司展开合作,针对自身特点制定推广营销策略。例如,企鹅兰登与peerindex数据分析公司进行合作,利用大数据技术对主流的社交媒体展开大规模的精确分析,按照粉丝数、观点数、转发量等指标找出社交平台中的意见领袖,利用他们在社交网络上的影响力提升营销效果。

美国公司Hiptype开发了一套电子书阅读分析工具,它不仅能统计电子书的试读和购买次数、消费者的年龄、性别、地理位置等信息,还能记录每本书读者读到了哪儿、平均看了多少页、读完后是否花钱购买以及最受欢迎的章节等信息,从而帮助出版商了解读者的阅读体验,更好地提供服务和进行销售推荐。

5.3 自建平台:“出版社+自建数字化平台”模式

该模式是传统出版数字化的必然趋势。一些大型出版集团拥有渠道优势和读者基础,他们通过建立自己的数字平台,吸引读者迁移到平台上阅读和消费。

例如《中国国家地理》通过自建平台积累了大量内容资源和用户信息资源,为发展大数据出版打下了基础。2012年该公司开始利用大数据改造自己的营销链。一方面,通过记录用户浏览频率、网页停留时间等分析用户的个人兴趣和内容偏好,并为其推送感兴趣的杂志内容,实现个性化营销;另一方面,为用户进行画像,并建立多重用户分类模型,从而进行商业广告的试投放。

6 市场服务环节的大数据应用模式

新闻出版大数据的深度开发、二次利用和开放共享让出版业市场服务的形式发生了改变。出版服务不再局限于图书产品,新的服务形式包括数据租售、内容分发、全产业链服务、知识服务、教育服务等,出版业市场服务环节进一步增值,形成了多种全新的大数据应用模式。

6.1 变身管道:信息聚合服务模式

越来越多的技术公司参与内容产业,为用户提供包括文字、图片、视频在内的内容聚合和个性化推荐服务。例如,今日头条不进行内容生产,而是通过对各大网站、社区、论坛的热点进行抓取来聚合全网新闻资讯,通过用户行为数据分析用户的资讯偏好,实现内容个性化推送。

6.2 打造闭环:全产业链服务模式

大数据时代,出版的外延不断丰富,产业链不断延伸,打造全产业链模式是出版实现各环节间战略协同的重要一步。亚马逊通过在上游购买内容电子版权、直接签约作者进行源内容建设;在中游通过电子书阅览平台、有声书收听平台和出版电商平台精准分发内容;在下游通过kindle和echo等硬件设备作为内容消费的有形载体和用户阅读行为数据收集的渠道。亚马逊通过内容生产、内容分发和内容消费的串联实现了产业链闭环,有效提升自身竞争力。

6.3 变现内容:知识服务模式

大数据时代,知识服务成为出版业内容变现的另一选择。学术出版商爱思唯尔在2010年完成了向信息解决方案提供商的转变,其数字化收入占到全年总收入的86%[14]。爱思唯尔基于自身数据资产的产品群囊括了100多个应用工具,其作用主要集中在四点:利用大数据分析帮助科研人员找到合作者,帮助科研人员找到需求信息,帮助科研人员管理信息,帮助科研人员分析数据,从而提高生产力,增加科研成果。

国内的电子工业出版社也推出了自身的知识服务产品——E知元,将旗下电子技术类图书分解为6000多个知识元并绑定在一个应用包里,满足专业用户对所需知识点的检索和应用。

热门文章
1
东风日产发动机存缺陷,高配车型无法铺货,引发天籁“失声”
2
任正非接受外媒采访回应一切 ,华为设备中绝对不存在后门
3
康佳、海信等厂商集中推8K电视:内容匮乏,大面积普及尚需时日
4
“十亿赌约”胜负已分,董明珠和雷军还会不会有下一个“赌局”
5
传音冲击科创板对标小米,只是一个传说
日排行 月排行

注册成功,欢迎来到蓝鲸财经!