每日经济新闻

    专访北大计算机研究所副所长汤帜:探索区块链版权保护但不炒概念 数字出版产业已到成熟期

    每日经济新闻 2018-03-28 17:28

    汤帜对《每日经济新闻》(以下简称NBD)记者表示,经过将近20年的探索,整个数字出版行业在技术上已经趋于成熟,而近两年发力的点则是文档处理和知识服务技术的升级。

    每经编辑 每经记者 张虹蕾    

    北京大学计算机科学技术研究所副所长汤帜

    每经记者 张虹蕾 北京摄影报道 每经编辑 任芷霓

    作为当代中国印刷业革命的先行者,计算机汉字激光照排技术创始人王选的“得意门生”,北京大学计算机科学技术研究所(以下简称北大计算机研究所)副所长汤帜已经在新闻出版应用技术领域征战已近30年。

    从跨进北大校门算起,今年已经是汤帜在北大学习和工作的第35个年头。自1987年师从王选教授攻读硕士研究生开始,汤帜就把全部的精力投入到软件的研究与开发。汤帜对于我国自有知识产权软件领域有两大贡献,分别为方正飞腾排版与方正阿帕比数字版权保护系统。

    业界对于汤帜的美誉颇多,有人说汤帜率领的团队的努力带活了一个产业,把Adobe强敌挡在国外。而在北京大学计算机科学技术研究所35周年之际,《每日经济新闻》记者专访汤帜,和他一起探讨中国数字出版产业近年来的变革之路。

    汤帜对《每日经济新闻》(以下简称NBD)记者表示,经过将近20年的探索,整个数字出版行业在技术上已经趋于成熟,而近两年发力的点则是文档处理和知识服务技术的升级。

    谈行业变革:2C赶超2B市场 深度内容待挖掘

    NBD:行业起步的十多年来,我国数字出版产业产生了哪些变化?

    汤帜:2000年初,国内互联网环境不够成熟,未形成个人支付习惯,数字出版基本没有2C市场,主要面向2B领域的机构服务。上述模式持续将近十几年,产业具备一定规模时,互联网风暴被掀起,网络文学也开始获取流量,近几年2C网络文学市场的用户量超过2B市场。

    NBD:网络文学也催生内容付费潮流的发展,这对数字出版行业带来哪些变化?

    汤帜:从技术角度看,网络文学以文字为主,一般基于网页浏览,对于文档处理技术要求较低。值得注意的是,虽然B2C市场看起来规模很大,但一些低俗猎奇文章充斥市场;相较于网络文学,内容有深度的专业电子书,特别是科技类电子书的B2C规模较小,这一市场销量大幅度提升还需时间。

    NBD:对于上述市场现象,有解决途径吗?

    汤帜:文档处理技术的升级或许是一个打开专业类市场的“突破口”。不同于网络文学的纯文字,专业类书籍则涵盖图表、公式,在处理复杂版式的过程中,需要用到“门槛高”技术。此外,要想解决上述市场现象,还需要产业界各方共同努力。

    谈发展突破:结合新技术挖掘应用点

    NBD:数字版权保护技术目前是否已经很成熟,还需要攻克哪些难题?

    汤帜:经历将近20年的探索应用,数字版权保护技术已进入成熟期。但不可忽视的是,随着技术更新迭代,也要求研究机构作出相应思考,为现有的数字版权保护锦上添花。

    比如,北大计算机研究所也会探索区块链在版权保护中应用,但目前究竟新技术能够产生怎样的化学反应尚不可预知。此外,作为研究机构,也不会关注热点概念“炒作”,而是去挖掘真正能够结合应用具体落地点。

    从研究层面和技术层面来看,我希望能够用先进的技术带来更好的阅读体验;但从市场角度来讲,出版方也需要有动力驱动,技术推广程度和也和受众素质及整体行业环境相关。希望阿帕比这类公司能根据此前技术积累不断革新,引领行业发展。

    NBD:您目前是研究者,此前也在企业作出相应指导,您认为一些数字出版的研究怎样才能更好落地?

    汤帜:从2000年开始带领团队研究技术,就一直沿着研究、开发、应用一条龙的模式去思考,研究成果和企业应用基本能够达到无缝衔接。而现在出现的变化则是,市场上数字出版的公司越来越多,我们也用开放的心态面对市场,不会拘泥于方正或者阿帕比某几家公司,而是把合适的技术提供给更需要的企业。

    例如,眼下化学公式的检索技术,在药物成分分析领域对于这一技术的需求十分迫切,就可以和相关单位达成合作和研究,在药物分子库的构建领域,提供分子式自动识别、检索等技术。

    谈技术演进:促进版权保护 降低人工成本

    NBD:阿帕比系统技术特点是什么?

    汤帜:阿帕比技术是从2000年开始做的,彼时,中国的数字版权刚刚起步,模式也仅是网络电子图书的在线购买。阿帕比技术主要的技术特点包括两个,一个是数字版权保护技术实现了产业链各环节的保护;另一个是实现了版式和流式融合的CEBX文档技术,使一个文档既支持原版原式的阅读或打印,也支持在移动终端高质量地实时排版阅读。

    阿帕比技术支持出版社、图书馆、电子运营商、读者等各个环节的版权保护技术,使得整个产业链条形成透明的交易环境,有利于出版社看到交易情况,定制相应机制,形成良性循环。

    NBD:技术革新是否也会降低人工成本?

    汤帜:是的,目前大家都在做移动数字阅读,移动阅读需要把PDF文件转换为其他流式阅读的格式,需要很多人工校对的工作。因此,我们研究版面分析与理解技术,使PDF转化为移动阅读格式时自动化程度更高,目前版面复杂的文档转化能够达到80%~90%准确度,未来希望结合人工智能等技术将转化准确率提升到99%以上。版面分析与理解技术还可以把表格、数学公式等复杂版面转换为结构化、语义化的信息。例如,针对上市公司年报的PDF文档,可以把其中的表格转换为Excel数据。

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    的哥做起“推销员” 打车平台又一波补贴大战开始

    下一篇

    深深房A:去年营收、净利均降四成



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验