每日经济新闻

    网络文学反盗版有了新技术 专家:提高公民对知识产权的尊重更重要

    天津日报 2018-03-29 17:07

    近年来,随着全社会对网络文学盗版现象的关注和共同抵制,网络文学盗版、抄袭现象得到了一定程度的遏制,特别是一系列技术反盗版手段的推出,一定程度上降低了网文盗版的发现难度。此外,针对名单内的作品,相关网络服务商应对其采取以下保护措施:直接提供内容的网络服务商在影片上映期内不得提供名单内的作品;用户上传内容的网络服务商应禁止用户上传名单内的作品;提供搜索链接的网络服务商、电子商务平台及应用程序商店,应加快处理预警名单内作品权利人关于删除侵权内容或断开侵权链接的通知。

    近年来,随着全社会对网络文学盗版现象的关注和共同抵制,网络文学盗版、抄袭现象得到了一定程度的遏制,特别是一系列技术反盗版手段的推出,一定程度上降低了网文盗版的发现难度。那么,这些技术又是如何发挥作用的?它们的效果如何呢?

    对内容监管:利用数据库,系统自动查重

    日前,阅文集团向相关媒体透露,阅文已经上线了特殊算法模型数据库,已实现快速查询底层能力,秒级内实时计算出指定章节内容重复度,为防抄袭提供大数据基础能力。这套针对抄袭行为上线的特殊算法模型数据库已经在整个阅文集团平台应用,在这个系统支持下,编辑可以实时查重作者上传的作品内容。作者每发一章,平台就可以自动对比全网书库,提醒编辑本章与书库中内容的重复率,以便人工查验是否抄袭,当重复率超过50%时,平台就会自动报警。

    不过阅文集团旗下起点中文网总编辑李晓亮也坦言,这套系统增加了服务器压力。

    ▲阅文集团旗下品牌(阅文集团官网/图)

    利用电脑技术自动对文章进行查重,这样的手段也许大家并不陌生,例如Microsoftword“比较”功能、中国知网推出的论文查重系统,等等,都是类似技术的应用。可见在技术层面上,这样的手段已经能够实现了。但是当这样的手段被运用到网络文学范畴内,还是有一定的困难,因为它所面临的检索对比目标是海量级别的。一般来讲,一篇博士论文可能是几万到十几万字,而网络文学作品动辄几十万甚至上百万字。所以,没有优秀的算法模型和功能强大的大型计算机作为支持,是很难在短时间内给出结果的。

    简单来说,算法是指解题方案的准确而完整的描述,不同的算法可能用不同的时间、空间或效率来完成同样的任务。而模型是一类问题的解题步骤,即一类问题的算法。

    阅文集团的算法模型数据库已实现“秒级内”出结果,可见在技术上是有所准备的。

    相比之下,晋江文学的查重系统,则更注重与人工配合。晋江的查重是基于用户举报,根据用户提供的抄袭证据,系统再将文章与数据库对比,进行核实,并基于系统设定的判定标准,将抄袭文章和被抄袭文章的雷同语段进行特殊标识,同时统计雷同语段,给编辑作参考,减少人工判断的难度。

    此外,记者还从国家版权局版权管理司了解到,从2014年开始,国家已经实施《重点作品版权保护预警名单》制度,也是被业内称为“白名单”的制度。如今,这套系统在电影产业运行得较为成熟,该制度要求版权企业报备希望重点监控的相关产品信息,利用国家监管平台对相关媒体平台进行监控,一旦出现盗版链接,系统会自动报警,类似于电脑病毒预警系统。此外,针对名单内的作品,相关网络服务商应对其采取以下保护措施:直接提供内容的网络服务商在影片上映期内不得提供名单内的作品;用户上传内容的网络服务商应禁止用户上传名单内的作品;提供搜索链接的网络服务商、电子商务平台及应用程序商店,应加快处理预警名单内作品权利人关于删除侵权内容或断开侵权链接的通知。

    2016年,“白名单”制度也在网络文学领域试水。国家版权局已于去年开始,督促各大文学网站积极报备重点网文信息,为网络文学“贴标”,也为系统积累数据资源,目前已经进入测试阶段。

    大规模的数据检索,离不开大规模的数据库。作为中国最大的网络文学公司,阅文集团也表示,目前已积累有效章节数达1.5亿,有效段落数达数百亿。

    对“抄袭者”监管:黑名单实时监管,区块链技术让盗版者无所遁形

    与“白名单”相对应,国家版权局还设置了一套“黑名单”制度,国家版权局版权管理司工作人员介绍:经常被投诉的平台,将对该网站进行重点监控,每季度随机审查,将《重点作品版权保护预警名单》内的作品,在该平台进行筛查,一旦发现问题,进行严肃处理。处理方式,一方面,版权行政管理部门加强与公安部门的配合,追究这种重复侵权盗版行为的刑事责任。另一方面,已有侵权记录的企业,再从事侵权盗版行为,版权行政管理部门加强和电信管理部门的合作,利用技术手段将其网站删除,让这样的企业不能继续开展业务。

    相关“黑名单”制度,在网文平台上也有所应用,比如晋江文学城对于被判定了抄袭的文章,会作出对应的惩罚措施,甚至于直接将发布者账号删除。此外,为了防止盗版,晋江根据对盗文者行为模式的分析,制定对应的防盗规则,付费章节作者可以设定对某些特定人群在一定时间内投放干扰性阅读内容,或是对一部分人屏蔽最新内容。

    不过,对于抄袭的技术筛查,有业内人士也提出过相关的困惑,例如掌阅负责人曾经谈到:在技术上掌阅几乎可以实时发现作品有没有被盗版和侵权,但只是发现还不够,还要找到归属,很多盗版是找不到归属人的。如何运用网络追踪技术,快速找到盗版侵权的主体并留存证据,也是摆在权利人面前的大问题。

    对于这一问题,正在“风口”的区块链技术提供了一种解决方案,国内已有相关企业将该方案落地。例如小犀智能提供的“犀链”,是一个基于区块链的版权综合服务平台,对于电子作品的版权确权是它的核心功能。“犀链”将作品名称、权利人和登记时间等核心信息生成唯一对应的数字指纹,并封存于不可篡改的区块链数据中,实现版权信息的永久存证,以技术公信力和可信度对版权进行确权。据介绍,“犀链”的区块链技术,已经得到了公证处与版权保护中心的认可,用户可以通过“犀链”在线申请公证书与著作权登记证。

    从某种层面来说,区块链解决了信息化时代中电子数据最大的痛点──易篡改、易灭失、难取证,它让信息更可信,并以此重塑互联网信任基础,特别是在版权方面,让作品的权属信息更为真实、可靠。

    专家意见:实现全面监管要提高公民对独创精神的尊重

    在谈到以技术手段反盗版时,中国文艺评论家协会网络文艺委员会委员吴长青坦言:新技术环境下,传播技术的发展一方面降低了侵权门槛,另一方面也使得作品的可识别性、侵权证据的可追踪性大大提高,在客观上降低了网络维权的难度,国家层面、企业、社会都在关注它,这是一种进步。但是要知道,反盗版是一个生态链,针对侵权、确权、维权环节,每一环的技术、制度、法规、意识都必须完善起来,才能形成一个良性的互动。与此同时,盗版者也变得越来越狡猾,网络版权侵权衍生出以聚合盗链、网盘分享侵权以及盗版小网站等新型侵权形态,手段隐蔽化、产业链条化、分工专业化,这就给打击盗版带来了新的问题。

    他谈到如今网络文学反盗版还有一个难点──雷同“模糊边界”的问题,这一点如今单靠技术手段还解决不好。文学的“剽窃”,有两种层次,一是形式上的,例如汉字重复、语句雷同,这是形式上;二是思想意蕴上的“雷同”,用不同的表达方式,去阐述了相同的思想意蕴,是不是“抄袭”“剽窃”呢?这是很难追究的。我们如今经常看到网络文学侵权案件中,提到“普遍的雷同”,其实所指的大多不是语言的雷同,而是思想的雷同。

    回望中国网络文学反盗版的历程,它是起于民间的,从作者进行维权、受众举报,发展到企业平台追溯、国家重视。在吴长青看来,中国网络版权保护发展的最大推力,是来自民间的声音,是受众权益意识的提高。全民法律意识和知识版权保护意识的提高,是非常重要的“防火墙”。所以,如今技术手段反盗版只是众多反盗版方式的一种,更为重要且行之有效的反盗版方式,还是要提高公民对知识产权的尊重、对独创精神的尊重。

    上一篇

    两部委:开展基本养老保险基金委托投资 实现保值增值

    下一篇

    国务院办公厅印发《知识产权对外转让有关工作办法(试行)》



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验