来源:吴晓波频道CHANNELWU
这篇文章开始之前,先邀请大家猜猜下面这份招聘要求对应的是什么岗位。
揭晓答案:这份看起来要求不低的工作,招聘的是AI数据标注员。在BOSS直聘上,这个岗位月薪最高接近两万元;部分岗位直接注明“重点大学本硕博优先”。
通俗地说,数据标注员就是AI的老师,负责对文本、图像、音频等原始数据进行分类、标记或注释,从而教会机器识别、理解并学习人类世界的逻辑和知识。
2020年起,“人工智能训练师”正式被纳入国家职业分类目录,“数据标注员”是其中的重要工种之一。据国家数据局,截至今年9月底,我国7个数据标注基地共有标注企业362家,标注从业人员达8.5万人。
但这个行业仍缺乏人才。量子位智库2023年底发布的《中国AIGC数据标注产业全景报告》显示,未来5年,中国数据标注专业人才缺口或达百万量级。
那么,数据标注到底是一份什么样的工作?
“985”“QS100”硕博,
给AI当老师
小鹅本科就读于一所“211”高校,目前在一家“985”高校读研,学的是历史学专业。她曾在大四那年做过一份数据标注实习的工作。
她每天的工作,就是面对一张科技公司发来的、填满后台收集的用户提问和AI生成答案的Excel表格,给AI的答案打分。小鹅处理一条数据平均花费的时间是15分钟左右,少数棘手的任务,单条就要花上近一个小时。
这份实习不需要面试,招聘方会提供一份打分标准手册和一套测试题,要求自学手册内容后,在测试题中选5道,完成后上交,正确率超过80%即视为通过。
小鹅当初花了一个下午学习这份标注手册,又花了2个小时完成5道测试题,才通过了考核。
起初觉得易如反掌的小巴,尝试了小鹅发来的两道题,结果正确率不足50%。这才发现,这份工作远比我们想象的困难。
◎ 首先,标注手册中包含大量术语,理解门槛极高。比如,“缺少富媒体形式”,是指答案中没有包含短视频链接;“prompt外泄”,是指答案暴露了提问未涉及的内部指令;“弱相关内容或冗余残留”,就是答案和提问没关系。
◎ 其次,打分要求极其繁琐、严格。标注者需要在“0、1、2、3”四个档位中给3个答案分别打分,并根据答案在准确性、结构性、相关性、全面性等方面的缺陷,分别打好标签,备注原因;然后把三个答案依次排序,逐一解释理由。
进行数据标注的工作人员
对于如何判定分数和标签,接近6万字的标注手册列举出了几十种具体分析场景,这些分析费时费力。比如,判断是否出现幻觉,需要一一核对参考资料;涉及专业知识,需要自己查找资料去验证。
除了打分,另一种常见的标注形式是“出题”,难度更大。刚获得海外语言类专业博士学位的小凡,求学时做了长达5年的数据标注兼职。她的工作是在一家海外众包标注平台上给AI出题并写出解答,难度达到博士级别。这些文本会被作为训练语料,喂给AI。
从招聘市场情况看,这份职业的天花板极高。
今年以来,各家头部大模型公司开始在招揽专家级标注员上竞速。比如,阿里搭建了“晓天睿士”专家社区,学历要求头部高校硕士起步,行业专家级人才最高时薪可达1000元。字节跳动成立了Xpert兼职众包标注平台,需要标注者上传简历、选择标注的细分专业领域,并完成难度较高的专业知识测试。
另一方面,行业的“入场券”也在快速涨价。
一位负责多家头部企业标注人员招聘的HR告诉小巴,近两年,标注岗位招聘要求不断提高。
早期招聘要求的学历水平大多在专科、高中,无需经验、上手就能做。但今年,候选人本科以上学历的占比超过五成。通用类AI标注开始有经验要求;垂直类一般要求相关专业或行业经验,部分岗位需要做专业笔试。
竞争也逐渐激烈,目前招聘通过率大约是2:1。
持续吸纳高端人才,成为标注行业肉眼可见的趋势。
部分公司数据标注招聘要求
不算体面的工种
顶尖人才正涌入数据标注行业,但身处其中的人们,大多态度悲观。
在高强度的标注实习中,小鹅感受到了这个行业巨大的矛盾。
▶▷其一,缺乏尊严。
小鹅最反感的是工作中没完没了的扯皮。文字判断有巨大的主观模糊空间,作为乙方的标注员与作为甲方的质检员经常会发生争执。比如,甲方认为A答案的逻辑性更强,而乙方认为B答案更完善。
在这些争论中,她感到标注员角色的巨大矛盾性:虽然承担着AI工程里超过60%的工作量,但他们在这个系统里是不被尊重的。随着模型的进化和调整,甲方给出的打分标准会经常变动,但标注员们往往无法撼动现有的标准,只能接受甲方的评判。
她也感到这份工作缺乏获得感。即便标注已经成为一个知识密集行业,但仍采取着流水线式的管理方式,绝大多数标注工作采取计件制计薪。标注的工作本质是消耗脑力处理一条条数据,但并不知道这些数据从哪来、到哪去,甚至不少标注员不知道自己标注的是哪个大模型。
▶▷其二,性价比低。
小鹅此前实习的公司是一家外包标注机构,项目团队里大多是兼职的大学生,每人每天至少完成10条,日薪100元,超额完成按10元/条计。
部分公司数据标注仅招聘兼职人员
即便是专家级别的标注,性价比也很低。一位入驻某家国内大模型专家社区的在读博士告诉小巴,自己在平台上出题的时薪大约在100—300元,收入并不比家教等其他兼职有吸引力。他很快放弃了这份兼职。
从招聘市场的薪资报价看,全职数据标注员的门槛水涨船高,但待遇低,在北京、上海这样的地区,不少标注岗位要求研究生级别学历,但月薪只有六七千元。
▶▷其三,上升空间狭窄。
一位AI产品经理向小巴介绍,他所在的头部互联网企业,标注岗位除了极个别管理岗位,其余均为外包,人员流动率极高,能待上超过一年的人并不多。
虽然理论上,数据标注员可以依次向标注组长、质检、质控、数据运营乃至算法类岗位发展,但因为技术类岗位的天然壁垒,真正实现的概率极低,绝大部分标注员会一直停留在原岗位上。
▶▷其四,即使门槛被知识抬高,标注本质上还是一份极易被AI替代的工作,“教会徒弟、饿死师傅”。
科技公司正在普遍采用合成数据减少对人工的依赖。比如,业内常见的降本手法“蒸馏”,即用ChatGPT等更高级的大模型生成的答案去训练更初级的大模型。中小型大模型厂商大多使用这种方法,降低数据成本。
因为这些原因,高端人才们进入标注行业,大多要么是寻求临时过渡工作,要么只是作为兼职获得一份收入,行业对他们难有长期吸引力。
大模型巨头开始“卷”数据
问题的本质,是标注行业的社会认知和管理方式,都没能跟上AI“知识饥渴”的速度。
过去8年,数据标注行业经历了巨大的变化。
这曾经是个非常底层的工种。它兴起于2017年前后,早期被广泛应用于智能驾驶。那时任务简单重复,比如框选图片上的红绿灯、汽车、障碍物。
因为又苦又累,多年来,海外科技巨头把这份工作转移到劳动力最廉价的地区。牛津大学的一项调查显示,全球有数百万数据标注员集中在乌干达、肯尼亚等欠发达国家,他们每天工作9小时以上,时薪仅约1.16美元(约合人民币8.3元),项目结束即失业。
OpenAI合作外包公司Sama公司员工
图源:Sama公司官网
在中国,数据标注产业主要聚集在中西部及三四线城市。在标注基地打标的员工,不少是待业青年、中老年人、残障人士,只要会使用电脑即可。
所以在大部分新闻报道中,数据标注员是一群AI世界里隐形的底层劳动力,在全世界欠发达国家、地区赚着“赛博流水线”上的微薄收入。
但最近两年,高端化的趋势开始在海外兴起。海外数据标注龙头Scale AI,从2024年开始关闭肯尼亚、尼日利亚、巴基斯坦等地的承包站点,转而招聘美国本土高学历人士。
据港媒报道,截至今年年初,Scale AI参与模型优化的人员中,12%拥有分子生物学等领域的博士学位,超40%拥有所在领域的硕士学位、法律学位或MBA学位。
相较于时薪仅1美元出头的低端标注,这些高端标注员平均时薪达到40美元。
而对专家级标注员的投入也确实推动了公司的增长,Scale 2024年营收约8.7亿美元,预计今年营收达20亿美元。Scale AI创始人Alex Wang公开发言称:“我们需要最优秀和最聪明的头脑来贡献数据。”
其竞品、美国另一数据标注巨头Surge AI,已经成为全球大模型追求高端数据时的首选。它把高质量的数据标注比作“写诗”,组建了一支由哲学家、工程师、常春藤盟校毕业生等构成的标注团队。
而国内的高端化趋势,很大程度上是从DeepSeek开始的。
2023年起,DeepSeek开始招聘“数据百晓生”岗位,不限专业、不限经验,实习生日薪超过500元,正职年薪可达百万。岗位要求之一是“涉猎广泛、博闻强识,对各行各业的知识都拥有强烈的兴趣”。
“数据百晓生”的主要任务,就是给AI出题、编写“理想态”的优质答案作为学习资料、给AI生成的答案打分和调试,等等。
结果也很惊人:DeepSeek上线7天用户破亿,靠文采飞扬、金句频出和严谨的深度思考破圈,业内盛传其标注团队由北大哲学系的学生组成。
此后,国内大模型界风向逐渐转变,开始在“特级教师”上做文章。
这种从“普通老师”到“特级教师”的需求变化,是AI进化到一定程度的必然结果。
AI行业有句经典名言“Garbage In Garbage Out”,一个模型能力行不行,很大程度上取决于训练模型的数据质量。据IBM的一项研究,仅注释质量提高5%,就可以将复杂计算机视觉任务的模型准确率提高15%—20%。
算法、算力、数据,是业内公认的AI三要素。头部大模型们在算法和算力上难分伯仲,数据质量成了最有机会“卷”出差距的方向。
AI变成精英以后?
可以说,自数据标注被正式认定为职业,经过5年的发展,这个行业仍面临着低壁垒竞争和劳动剥削等诸多问题,处于一个难以定性的状态。
但在每个新兴行业出现、创造新工种的早期,都会出现类似的问题。所有的职业,都是先出现,再进化的。
这份工作的前景也未必真如想象中渺茫。比如,它提供了一种职业转型路径:成了一条文科生在AI领域大展拳脚的神奇过渡带。一些头部大模型已经开始组建“AI人文训练师”团队,训练AI识别“仇恨言论”和撰写“高情商回复”。
而这些文科生,也在这份工作中不断触碰AI与社会的边界。小鹅说,在结束这份实习以后,她手机里的AI总是比别人的好用,因为理解底层逻辑,她更擅长下达精确的指令。
这是个需要高质量人文社科人才的岗位,因为只有最善于思考人与世界关系的人类,才能教会AI怎么更好地做一个人。
学习使用AI办公技巧
换个角度看,在高学历人才该不该去“打螺丝”之外,还有一件事值得关注。
在小鹅标注的上千条数据中,她印象最深刻的一条记录是,一位用户向AI提问“残疾人患脑癌能不能进养老院”。小鹅翻阅此人的过往提问记录,发现她向AI倾诉了很多自己各方面的困难,包括离婚、家暴、病重和无人赡养。但对于AI而言,这些提问不过是一条条平平无奇的数据流。
当AI在顶尖老师的训练下变得越来越顶尖,它就像一个含着金汤匙出生、接受正统通识教育的古希腊式精英,逐渐无法再看到更基层的需求。
或许下一步,新的鲶鱼就会从这些被忽视的需求中跳出来。
*文中受访者姓名均为化名
本篇作者 |温若梅| 责任编辑 | 徐涛
主编 | 何梦飞 | 图源 | VCG、网络
特别声明:以上内容仅代表作者本人的观点或立场,不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的,请于上述内容发布后的30天内进行。