Facebook Messenger总语音流量50%来自柬埔寨的原因曝光

摘要:

2018年,Facebook的团队遇到了一个难题。根据举报人Frances Haugen公布的文件了解到,柬埔寨用户占Messenger语音功能全球总流量的近50%,但这家公司却没有人知道原因。

根据Rest of World查看的内部文件,一名员工建议进行一次调查。他们想知道,这是否跟识字率低有关?同一份文件显示,在2020年,Facebook的一项研究试图询问音频使用量大的国家的用户,但只能找到一个柬埔寨的受访者。这个谜团,似乎一直没有解开。

现在,令人惊讶的是,答案跟Facebook的关系不大,而是跟高棉语的复杂性以及用户适应一项从未考虑过的技术的方式有关。

在柬埔寨,从嘟嘟车司机到首相洪森,每个人都喜欢发送语音笔记而不是信息。Facebook的研究显示,不仅仅是柬埔寨人喜欢语音信息--尽管没有其他地方比它更受欢迎,在这项研究中,包括来自多米尼加共和国、塞内加尔、贝宁、象牙海岸的30名用户以及那位单一的柬埔寨人,87%的受访者表示,他们使用语音工具来发送跟他们应用上设置的语言不同的笔记。WhatsApp--调查对象中最受欢迎的平台--以及Messenger和Telegram上面的情况都是如此。

最常见的原因之一是什么呢?--打字太难了。

在柬埔寨的情况下,从来没有一个简单的方法来输入高棉语。虽然高棉语Unicode很早就被标准化了,但在2006年至2008年间,键盘本身却落后了。第一个高棉语电脑键盘的开发者必须适应该语言的74个字符,这是世界上所有文字中最多的。

这显然是一项艰巨的任务。Javier Sola是一位出生在西班牙、居住在金边的计算机科学家,他是2005年最初高棉操作系统项目的团队成员。

现任柬埔寨非政府组织Open Institue执行主任Sola告诉Rest of World:“高棉语的符号比拉丁文多得多。”在拉丁文键盘上,用户可以一次看到所有的字母,这使打字变得直观。但在高棉语中,每个键都有两个不同的字符,这需要在两个键盘层之间反复翻转。不仅如此,有限的字体意味着,如果收件人的电脑没有跟发件人相同的字体,一些信息就无法出现。不过,用户们还是成功了。

2009年左右,Facebook在柬埔寨开始流行,与此同时,廉价的智能手机和互联网接入也开始出现,这意味着它的使用量爆炸性增长。今天,它仍是该国最受欢迎的整体平台。但在一个小的智能手机屏幕上,同样的打字系统变得几乎不可能。

2016年美国国际开发署的一份报告显示,智能手机用户更喜欢电话和语音信息,因为他们发现打字很困难、很费时间或因为他们对如何使用设备上的高棉文字感到困惑。一些受访者甚至没有意识到他们的设备支持这种语言。西方用户认为理所当然的其他功能--如准确的拼写检查或光学字符识别--在高棉语中仍只具备基本的功能,这让用户对文字使用感到沮丧。

Sola表示:“现在有了稍微先进的键盘,但它们没有预装在手机上--跟Google、三星微软的键盘不同。”多年来,人们的习惯已经硬化为接受。他称,在柬埔寨,语音信息只是人们的选择。

这不仅仅在Messenger。在柬埔寨其他流行的平台上,诸如Telegram、WhatsApp和LINE,用户也都喜欢用语音。虽然没有来自Facebook的最新语音流量数据,但在首都金边的柬埔寨人告诉Rest of World,他们认识的绝大多数人都依靠语音工具来获得便利和表达能力。用户说,他们并不觉得在功能上受到欺骗,而是更喜欢发送和接收语音信息的轻松感觉。总的来说,他们对在公共场合说话并不感到害羞,在街上录制信息也很自在。

创意行业的自由职业者Leng Len表示,这很难再回去了。“它可以进行最有机的表达,并且比打字更快。”

但对语音工具的依赖也产生了它自己的一系列特殊问题。对话变得短暂了。这些用户还抱怨称,他们无法回滚以回忆他们交流的细节,只能通过记住他们留下的语音信息的具体模式来重放这些信息--比如一个长的和两个短的。聊天记录中的内容不可能使用搜索功能。然而,与此同时,这种不便似乎并没有超过其弊端。现在的书面信息往往以商业或英语交流为主。

虽然Facebook的员工想象这种行为跟低文化水平有关,但根据世界银行的最新数据,柬埔寨的识字率约为80%。

“许多年轻人,如果他们想打字,就会用拉丁文写出高棉语单词,”金边的软件工程师兼POSCAR数字公司CEO Sok Pongsametrey指出。POSCAR是一家为教育建立数字工具的公司。其他时候,如果一个字母太难拼写,他们可能会采用更容易获得的字符来错误地拼写这个词或用省略号来缩写一个词--因为他们知道读者会理解这个隐含的词。

这有连锁反应。Sok称,这些类型的变通方法使从事机器学习的工程师更难用这种语言来训练人工智能。另外他还担心,这些捷径将意味着年轻人将失去对高棉文字的熟悉。

“当我用高棉语写作时,我非常小心,因为这是一门艺术,但是年轻人,他们认为(使用拉丁文本)非常容易,”Sok说道。

语音信息在柬埔寨的主流化引发了关于内容控制和错误信息传播的问题。音频是出了名的难以扫描、缺乏上下文线索,且跟视频相比,很难分辨它是否被篡改过。

音频信息证据已在一些引人注目的案件中出现,例如逃离柬埔寨的佛教活动家Luon Sovath,他称柬埔寨当局捏造了有罪的信使录音。

当被问及在柬埔寨进行这种调节的资源时,Facebook(现在称为Meta)的一位代表只提到了一般的措施。“用户可以报告Messenger上的任何内容,包括语音信息,我们以高棉语为母语的团队将对任何违反我们政策的内容进行审查和强制执行。”

发言人还提到了检测有害视觉内容的工具以及仇恨分类器,但没有具体回答Rest of World关于音频控制的问题。

Javier Sola指出,有一些较新的键盘如微软的SwiftKey,让高棉语输入变得更容易一些,但许多柬埔寨人甚至不知道它们的存在。

柬埔寨只是一个市场,许多科技公司对开发更好的产品不感兴趣。“他们在这里赚不到钱,所以他们不投资,”Sola说道。

为此,柬埔寨的用户继续适应着这种模式。当被问及她是否认为语音信息会被更好的技术所取代时,Len表示怀疑--“我不这么认为。它有助于促进更有效的对话。”

查看评论
created by ceallan