0次浏览 发布时间:2025-03-18 17:08:00
去年11月,上海市人社局等七部门联合发布通知,围绕集成电路、生物医药、人工智能等上海三大先导产业,以及养老护理、家政服务行业加强重点产业领域技能人才培养。在《上海市重点支持技能人才职业(工种)目录》中,从药物制剂工到半导体芯片制造工,再到工业机器人系统操作员,一系列新职业、新岗位为人才培养提出了新需求。
其中,职业编码为4-04-05-05的新工种“人工智能训练师”相较列举的上述职业来看,似乎有些“抽象”——训练什么、如何训练、谁来训练,以及训练师如何培养、需要哪些资质、如何为企业所用并赋能社会经济发展,这些问题对于从高校到社会各界的人才培育环节来说,每一环都是挑战。
在位于漕河泾开发区徐汇本部的越界锦和尚城园区,一家名为“解螺旋”的医学研究智能平台企业,在2年多前就敏锐洞察到AI技术在医学领域的巨大潜力,较早设立了“人工智能训练师”岗位。伴随大模型产业在过去两年间的飞速迭代,这一崭新的职业工种不仅为企业的技术发展注入了新活力,也让人们不禁思考,“AI+传统行业”是否正迎来新的转型契机。
需求诞生岗位
“80后”叶子是解螺旋的一名人工智能训练师。每天早上来到工位,他的工作就是面对屏幕那头的大模型,将传统的工作流程拆解为AI能够明白的指令,然后一遍遍调整指令、调试AI程序。
2022年,以ChatGPT为代表的大语言模型开始爆发,解螺旋于2023年在公司内选调了一批具备医学、生物学等学术背景,兼具计算机、编程等知识技能的员工,转岗为人工智能训练师,2年多来已建立一支数十人的人工智能训练师队伍。这些训练师的日常工作是基于不同的应用场景来训练模型,比如文献检索、文献解读、语言润色、专业翻译等,均与企业的主营业务密切相关。
解螺旋首席知识运营官翠翠介绍,这些领域具有一定的共性,都是人工耗时长、有成熟的人工操作标准流程,并且企业内部多年来已积累了一定量级数据的任务场景。
以文献调研为例,这是科研中非常耗费精力的一环,但执行流程却很清晰——用户撰写检索用的关键词、检索信息源或本地知识库、检索返回的数据、泛读后粗筛出相关内容,最后通过精读来获取最终信息。模块化的流程很适合转化为AI场景,而使用AI大模型来完成可以比人工快上百倍。
对企业来说,在通用大模型基础上,开发和训练一套适合企业的垂类模型或智能系统,能大大提升服务效率。这也是为何,解螺旋的首批人工智能训练师,是从公司内部既具备专业背景又熟悉公司业务场景的资深员工中招募而来。
以叶子为例,他是一名临床医学的硕士毕业生,具备专业医疗机构的从业经历。9年前加入公司时,他负责微信公众号的内容生产。在此过程中,他逐渐使用大语言模型来辅助自己生成推文,效率提升非常明显,并且他还具备撰写代码的能力。
位于漕河泾开发区内的解螺旋总部。 舒抒 摄
小众成为大势
与传统的算法工程师、数据标注员相比,人工智能训练师的差异是什么,为何能独立成岗?
“人工智能训练师可以让AI更好地理解具体业务场景下人类的语言、行为和意图,让大模型、机器人等AI智能体具备一定的人类智慧,并准确执行任务。”一位业内人士告诉记者。训练AI的过程会涉及多种具体工作,包括数据清洗和标注、模型训练和优化、人机交互设计和开发、数据安全策略等。
同很多自研垂类大模型的企业一样,解螺旋正尝试基于市场已有的基础大模型进行二次开发。在这一过程中企业发现,通用大模型虽然能力很强,但在解决具体问题时给出的答案与企业的实际需求仍有差距。
某种程度上,人工智能训练师就是让企业需求和技术供给“对齐颗粒度”的人。
叶子最近正在持续训练大模型的文献查阅能力。在解螺旋的平台上,用户输入检索需求,大模型能根据信息源检索命中并回复相应的信息。但检索词并非“万物皆可为”,而是需要人工智能训练师提前训练好模型,使其具备能够根据不同用户需求给出精确答案的能力。
这一能力也称为“预设”。比如,用户上传文献并使用文献解读功能时,大模型能帮助人类“把书读薄”,将动辄数十页的文献总结到一张纸上。这背后是人工智能训练师为用户提前“训练”好的模型,让模型有能力理解专业文献的结构、方法和内容。用户只需输入“精读”“解读数据图表”等简单的提示词,就能收获相应的答案。不过,目前上述功能都需要付费使用。
在智能问答领域,大模型的训练效果更为明显。人类客服无法做到7X24小时回复,而AI客服可以全天候在线,并在同一时间回复数千名用户。
这也是AI大模型逐渐成为大势产业后,人们普遍关心的问题:AI技术如何切实提升企业效益,从而为社会经济发展贡献积极作用。
教会徒弟并不会饿死师父
随着AI技术迭代,人工智能训练师是否终有一天会被AI代替,出现“教会徒弟饿死师父”的情况?在回答这个问题前,先要了解人工智能训练师与AI交流的方式:在输入自然语言指令时,是尽量去描述AI能够听懂的话,即“提出正确的问题”,还是人类想说什么就说什么,让AI来适应人?
在翠翠看来,从趋势看一定后者, 至少人类在训练人工智能时使用的已经是自然语言而非代码。同时,在科研领域,原先“人做、AI辅助”的模式正转为“AI做、人审核”的协作模式,未来甚至可能转为“人提目标、AI来搞定”,效率可提升百倍千倍。“但AI只是用于科研工作的赋能与提效,AI生成物还需要专业人士的判断和修正,并不是要完全代替人的工作。”
这就延伸出另一个问题:AutoML(自动化机器学习技术)等AI工具,会削弱人工智能训练师的岗位价值吗?在业内人士看来,专业领域智能化的过程,需要精通该专业工作的人来主导,而“35岁+”的职场人恰好兼具丰富的行业经验和理解智能化需求的能力,在人工智能训练师的岗位上能展现不可替代的优势。
记者了解到,在职的技术人才想要获得“人工智能训练师”的认定,一方面要参与企业所在区域开展的培训与考核。另一方面,不少企业正在摸索一套个性化的培训机制,围绕行业所在的垂直细分领域,培养员工开展数据标注、模型训练与优化等工作。
最近,叶子正在备考上海市人工智能训练师项目的社会化职业技能等级认定。虽然考核涉及的数据处理、代码调试、流程设计、大语言模型分词技术等对他来说都不陌生,但他仍认真参与了线下培训并利用每周的业余时间复习。
在他看来,虽然在人工智能训练师的岗位已经工作两年多,但通过参与市级层面的认定,自己对人工智能通行的技术和规范有了更全面的了解,向“既懂医学又懂AI”的复合型人才更进了一步。
记者采访中还发现,对积极开设人工智能训练师岗位的企业来说,在员工获得职业技能补贴、企业获得培训补贴的同时,政府为企业适时适量提供算力补贴,也能有效激发企业的积极性——用“真金白银”的投入,鼓励企业创造更多新型就业岗位。
原标题:人工智能训练师:人类把AI练聪明后,会不会“教会徒弟饿死师傅”
栏目主编:茅冠隽 题图来源:上观题图
来源:作者:解放日报 舒抒