大数据时代,如何在“数据污染”下出泥不染?

来源:中国传媒大学校报浏览次数:1715发布时间:2018-12-11

不久前,知名歌手吴亦凡的新专辑登陆美国,上线不到五小时便跃升iTunes总榜销量冠军,并以夸张的优势拉开第二名1700倍之多,创造了世界级的记录。但国外用户对此并不买账,全网质疑声浪迭起,舆论集火中国水军刷榜,iTunes官方也很快介入调查并及时修正了数据,吴亦凡的新专辑竟从从第一名掉落至百名开外。

大数据时代,信息获取前所未有的迅速和简单,我们期望它能赋予我们前所未有的洞察力。但这次人们被数据造假戏耍的事件已经在警示着我们,数据越是发达的时代,它也越有被污染的风险,如何在污染里出泥不染,是数据链条上的每一方,都需要思索的课题。

大数据是现代信息技术高度发达的产物,最直接见效的治污方式,也便是在数据的提供者端口以技术手段切入,切断污染的源头。在计算机信息领域,算法是处理大数据的核心技术,而iTunes榜单的排名算法存在明显的单一化缺陷,即它仅以下载量为衡量标准,而且给了专辑出版当天下载量8倍的计量权数,这简直是刷榜行为最舒适的温床,刷榜者仅需在出版当天集中进行大规模下载便能轻易创造出一个短时的相当好看甚至高到夸张的榜单成绩。反观欧美另一权威音乐榜单billboard,其采用的全面综合电台、下载销量、主动流媒体、实体销量等各方面进行排名统计的算法,将榜单的失真率大大降低,有效地保障了其权威性,实为iTunes很好的借鉴。好玉石还需好雕工,要发挥数据最大的价值而不是让数据误导他人,作为数据提供方,必须要有精细的技术去“雕琢”好每一份数据。

处于数据高地的资本力量具有极强大的数据操控能力,应该树立社会责任感,不应唯利是图,更应把商业的目光放得长远一些。当大数据渗透入互联网这个巨大而复杂的利益博弈场,利用数据控制能力的绝对优势去收割利益的商业行为也越来越多地成为资本力量的盈利手法。除了简单直接的经纪公司花钱买粉丝、买转发来提高艺人人气和流量,更高级的粉丝运作产业链也在文化娱乐圈兴风作浪。一些商家利用粉丝的攀比心理,鼓励他们用数据的高低来证明“爱的分量”,有的公司甚至会专门制作明星品牌影响力排行榜,以培养和刺激刷榜需求,偶像明星的流量刚需叠加商家处心积虑的营销手段,附着在粉丝发自内心的“为爱发电”情绪上,刷榜行为也就水到渠成。这些看似聪明的运营操作,实则为短视的涸泽而渔。就如这次的iTunes刷榜事件,无疑是对未来中国文化走出去声誉的一次严重毁坏,而不靠优秀作品说话反而靠数据流量说话更是纵容了劣币驱逐良币的行为,无疑是窒息未来优秀文化作品的诞生。自作聪明的数据污染,其实是在污染自己赖以生存的土壤。

提供数据的上游,加工数据的中游,最重要的还是接收数据的下游,我们普通网民正是这一中上游污染过后的最终影响者,所以作为大数据时代的合格网民,养成理性对待和分析数据的基本素养是非常必要的。在复杂的网络舆论场里生存,不想被污染过的数据忽悠当枪使,首先要明确数据的本质属性:它是用作说服他人的一种事实论据。作为论据的第一要义就是保证其客观真实性。拿到数据后必须要思考,是谁想让我看到这个数据的?以数据作为论据他们想说服我接受什么观点?拿到的数据本身就带有强烈的价值倾向,提供数据的人本身就是利益相关者,常常会是发生数据污染的重灾区。只有在网络空间里时刻保持对数据污染的敏感,才能出泥不染,免做被操控的舆论“傻白甜”。

污染出的数据就是自欺又欺人的恶之花,永远也不会长出善之果。数据本应是指引我们前进的灯塔,而不是暗中袭击我们的礁石。只有每一方协力铲除这朵恶之花生长的土壤,才能还大数据发展和我们共同的网络空间一片风朗气清的环境。

(编辑:黄诗雅)