数据工作者在DAIR报告中详述科技行业内容节制过程中存在的剥削行为
数据工作的基本劳动,如修改和注释被系统性地隐藏起来,不让那些从劳动成果中受益的人看到。一个新项目将世界各地数据工作者的生活经历置于聚光灯下,以第一手资料展示海外科技工作的成本和机遇。
许多乏味、吃力不讨好或有损心理健康的工作被外包给了更贫穷的国家,那里的工人乐于以美国或欧洲工资的一小部分来从事这些工作。这种劳动力市场与电子产品"回收"和拆船等其他"乏味、肮脏或危险"的工作一样。适度工作或注释工作的条件不可能让你失去一只胳膊或患上癌症,但这并不意味着它们是安全的,更不会让你感到愉快或有成就感。
数据工人调查"是人工智能伦理研究小组DAIR和柏林工业大学的合作项目,名义上是以马克思在19世纪末的工作为蓝本,在"集体制作和政治上可操作"的报告中确定劳动条件。
所有报告均可免费获取,并在今天举行的一次在线活动上发布:
https://data-workers.org/about/
人工智能应用范围的不断扩大必然建立在人类专业知识的基础上,而这种专业知识至今仍是以公司所能提供的最低价值购买的,同时又不会引发公共关系问题。当你举报一个帖子时,它不会说:"很好,我们会把这个帖子发给叙利亚的一个人,他只需支付 3 美分就能搞定。"但是举报的数量(以及值得报道的内容的数量)如此之高,除了将工作大规模外包给廉价劳动力市场之外,其他解决方案对相关公司来说并无实际意义。
细读这些报告,它们大多是传闻,而且是有意为之。这些报告与其说是定量分析,不如说是系统的人类学观察。
对这类经历进行量化往往无法捕捉到真正的成本--你最终得到的统计数据都是公司喜欢大肆宣扬的类型(因此在研究中也会征求这些数据):比该地区其他公司更高的工资、创造的就业机会、转嫁给客户的成本节约。很少有人提及节制工人因噩梦而失眠或药物依赖猖獗等问题,更不用说对其进行衡量和介绍了。
以 Fasica Berhane Gebrekidan 关于肯尼亚数据工作者在精神健康和毒品问题中挣扎的报告为例 。(PDF 全文请点击此处)。她和她的同事为 Sama 公司工作,该公司标榜自己是一个更有道德的数据工作管道,但实际工作情况正如实际工作者所描述的那样,是无尽的苦难和缺乏当地办事处的支持。
举报人拍摄的肯尼亚 Samasource 公司的审核工作空间。 图片来源:Fasica Berhane GebrekidanFasica Berhane Gebrekidan
报告称,他们被招募来处理当地语言和方言的举报内容,这意味着他们会接触到无休止的暴力、血腥、性虐待、仇恨言论和其他内容,他们必须快速浏览并"采取行动",以免他们的表现低于预期水平,导致被扣工资。对于某些人来说,这意味着他们每分钟都要浏览超过一条此类内容,也就是说,他们每天至少要浏览约 500 条此类内容。(如果你想知道人工智能在哪里--他们很可能正在提供训练数据)。
"这绝对让人心碎。我看到了可以想象到的最糟糕的事情。我担心我会因为做这份工作而终生留下伤疤,"受访的承包商之一拉赫尔-格布雷基尔科斯(Rahel Gebrekirkos)说。
辅助人员"装备不足、不专业、素质不高",主持人经常求助于药物来应对,并抱怨有干扰性想法、抑郁和其他问题。
我们以前听说过一些这样的事情,但现在听说仍在发生,还是很有意义的。这类报道有好几篇,但其他报道更多的是个人经历或采用不同的形式。
例如,YasserYousef Alrayes 是叙利亚的一名数据标注员,靠工作来支付高等教育学费。他和室友一起从事可视化注释工作,比如解析文本图像,正如他所指出的,这些图像往往定义不清,而客户的要求又令人沮丧。
他选择以短片的形式记录自己的工作,这部短片非常值得您花八分钟的时间来观看:
像亚瑟这样的工人往往被掩盖在许多组织层级的背后,充当分包商的分包商,这样一旦出现问题或诉讼,责任界限就会模糊不清。
DAIR 和柏林工业大学的 Milagros Miceli(该项目的负责人之一)告诉我,他们还没有看到报告中提到的公司提出任何意见或改变,但现在还为时尚早。但这些结果似乎足以让他们回去继续研究,她写道:"我们计划与第二批数据工作者一起继续这项工作,他们很可能来自巴西、芬兰、中国和印度。"
毫无疑问,有些人会对这些报告不屑一顾,因为这正是它们的价值所在:它们的轶事性质。但是,统计数字很容易说谎,而轶事却至少有一定的真实性,因为这些故事都是直接从源头开始的。即使只有肯尼亚、叙利亚或委内瑞拉的十几位审核人员存在这些问题,他们所说的情况也应该引起所有人的关注。