信息时代“输入”已成为人们每日最常见的生活场景,而“亲爱的”才是网民间最常使用的称谓。近日,搜狗输入法大数据团队联合中国人民大学新闻与社会发展研究中心发布了《中国网民的信息生产及情感价值结构演变报告》,基于搜狗输入法的输入热度,“报告”通过对近年来一系列输入数据的统计,展现出中国网民在公私领域及特殊群体、社会关系中的社会观念变迁,进而凸显社会主义核心价值观的社会认知。
从此次发布的报告看,搜狗输入法从最初满足用户对基本文字的输入需求,再到现在语音输入的升级以及跨界服务,正通过大数据以及人工智能等创新技术,让亿万网民在表达和获取信息方面变得更丰富、更智慧,同时也将在网民的信息生产、社会话语表达以及情感沟通中发挥着重要价值。
爱直播、更爱发红包
此次发布的《中国网民的信息生产及情感价值结构演变报告》,可以说第一次从输入大数据的角度,以中国网民信息生产行为与内容、中国网民公私领域特点、特殊人群及社会关系的变迁以及社会主义核心价值观四个维度,勾勒出中国社情民意的变迁。
据统计数据显示,在行为层面,中国网民日均打字总数达350亿之多,20062016年十年内,年均打字总数达到127750亿字,其中晚间22点睡前阶段,是网民全天打字最活跃的时段,社交类网站(App)以超过九成的比例,占据网民经常登陆的网站或App中的最大份额。
过往五年间,“直播、发红包、刷屏”是网民提及度最高的网络行为,而“亲爱的”成为了网民间最常使用的称谓。在内容层面,女性比较热衷于使用表情符号,关注八卦与感情,而男性更倾向于政治。
一个有趣的现象是,在私人话题方面,爱情仍是核心、工作排在第二,购物是民众除了维持社会关系网之外的第一核心领域。报告中还对四个网络世代的网络行为给出了数据,00后喜欢休闲娱乐和社交、80后表现为查找资料与看新闻,70后是实用主义,喜欢浏览新闻和与他人联系。
可以说,该报告用大数据“诉说”了网民行为及情感表现。本次论坛吸引了众多学界、政界与业界代表的参与,并且还就互联网、大数据和人工智能等新兴技术对舆论学研究带来的机遇和挑战等问题,进行了广泛深入地探讨。
“搜狗输入法到2016年已经打造了十年的时间,伴随互联网发展,成为一个观察者和参与者,使命参与是产品和技术创新,同时我们也看到了网络文化快速的发展。”谈到输入法的意义和影响,搜狗CTO杨洪涛表示,此次以数据报告的形式,通过输入法对五年来网民信息生产以及社会话语表达的记录和回顾,也反映出搜狗作为科技企业,在承载社会情感沟通和社会话语整合方面所具有的价值和影响力。
引领智能化创新
事实上,从报告本身内容看,也展现出搜狗输入法在大数据积累、挖掘和分析方面的行业领先优势。
通过持续的技术创新以及不断上线新产品、新功能,搜狗输入法已经赢得了广大网民的认可和青睐,目前在PC端的用户规模排名中国第一,移动端用户数也超过2.5亿,仅次于微信和QQ稳居中国第三大手机应用。
过去十年间,在用户体验方面,搜狗输入法从考虑输入法布局、按键间距、文字大小的合理改动,再到搜索引擎词库、智能组词算法、细胞词库、人名组词、云输入以及动态皮肤、表情、颜文字、花漾字等的推出和完善,搜狗输入法让中文表达变得有趣又丰富,极大提升了国民的信息生产效率,也吸引了90后、00后等极具潜力的新生代年轻群体加入,成为互联网时代独特的文化现象。
此外,在挖掘原创皮肤、表情以丰富用户体验和个性化表达的同时,搜狗输入法也在进一步完善和发展生态圈,构建了皮肤、表情、用户、原创作者多位一体的输入法生态圈,以覆盖和影响更多的优质用户群体。
而随着科技的发展以及互联网创新理念的逐渐深入,搜狗输入法也在不断完善各项功能以及服务,未来将集中在人工智能领域,通过引人大数据,机器学习等人工智能技术,向自动问答和智能回复发展,打造更自然的人机交互模式。
在刚刚落幕的乌镇互联网大会上,搜狗CEO王小川深度解析了人工智能的现状和未来。王小川提到人工智能有三个产品方向,一是识别,包括语音识别、图像识别、视频识别。二是图像,三是创造。
“在中国,搜狗输入法在移动端活跃用户2.8亿。搜狗有完整的语音识别技术和语音合成技术,但是在我内心,这个远不是输入法的极致。”王小川认为,输入法真正的极致是从一个拼音工具走向一个对话和问答系统。
目前在搜狗,语音和图片识别都已变成很重要的一部分,搜狗输入法每日处理的语音达1.9亿次,提供超过16万小时的语音语料。而伴随人工智能的进一步演进,人工智能与人类之间的关系变得更加复杂,王小川认为人工智能未来将不仅仅涉及到技术,还将涉及到社会学、伦理学等更为深刻的命题。
可以说,搜狗输入法这一系列的升级以及跨界服务,都在于创造更大的价值,让表达和获取信息更简单、更丰富也更智慧,引领行业走向智能化的创新发展。
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。