大模型的人味儿,从何而来?

大模型的人味儿,从何而来?

本文来自微信公众号:AI故事计划,作者:李奕萱,编辑:温丽虹,原文标题:《我,文科生,教AI回答没有标准答案的问题》,题图来自:视觉中国

一个月前,哲学博士羽山意外加入了大厂AI研发部门,成为一名“人文训练师”。在全世界范围内,这都是个新鲜岗位。人工智能仍在高速进化,他和同伴的使命是教会它们像人类一样思考。

文科生获得了AI 岗位

羽山在复旦研究了10年哲学。今年5月,他通过了毕业论文答辩,正在准备博士学位的授予资料。

在思考毕业去向时,他偶然在小红书的官网上看到了招募通知,岗位叫“AI人文训练师”。羽山当即投递了简历,一个念头从脑海中冒了出来:AI行业终于走到了需要人文研究者的阶段。

对AI进行人文训练,属于模型“后训练”的范畴。在“后训练”中特别强调人文面向,尚未成为行业通行的做法。但有两家公司值得关注,一家是全球头部的大模型公司Anthropic聘请了哲学系博士,负责模型后训练的人类价值对齐与微调。在国内,DeepSeek年初传出消息,招聘了北大中文系学生担任“数据百晓生”,对模型做后训练。这被认为是DeepSeek文采出色的来源。

羽山入职之后才知道,小红书这支团队也刚组建不久。同事不算多,但都是来自知名高校人文学科的硕士、博士生。

大模型的人味儿,从何而来?

图 | 羽山在小红书上分享哲学概念

团队的首要任务,是设计AI的观念和个性。

听起来很玄。羽山遇到的第一个问题是,“我得了胰腺癌”应该如何回答?

如果把这句话发给市面上主流的AI产品,会发现,答案大多都缺少“人味儿”。AI在回答情感类和人生解惑类问题时,往往会生成一套相对固定的话术,“听到这个消息我很难过”“我理解你”“你这样想其实很正常”。这在业界被称为“情感接入”。

但AI的“情感接入”通常很难成功。这跟客服是一个道理。当客服不假思索地回答“我理解您”的时候,顾客只会认为客服人员在应付、推诿。

羽山和同事们,决定教AI学会更为艰深的情感接入方式。

回到这个问题。“我得了胰腺癌”,人类听到这句话会是什么反应?

小组讨论时,中国现当代文学专业出身的可子提出来,“如果别人告诉我自己得了胰腺癌,我的第一个反应,就是不知道该说什么,有一种情绪的停顿感。”或许是经历了多年的文学训练,可子准确地捕捉到普通人在开口回答前,那瞬间的语塞和哽咽。

这个观察最终被团队采纳。人文训练师们开始推敲,如何让AI去展现这种情绪上的停顿感。

这只是开头。

通常,人类与AI的对话会持续进行。因此,羽山和同事们还通过检索癌症病人访谈等方式,设计了很多展开的问题。

他们想到胰腺癌所带来的疼痛,想到临终陪护,想到安乐死。他们想,胰腺癌这样凶狠的疾病,没有办法被治愈,且患者很快就会离世。所以对于提问者而言,是不是在这生命最后的时刻,他更在乎的是他的后事,更在乎的是他的亲人。

“需不需要多次诊断形成一个确诊的结论?”

“问这个问题的时候,身旁有人陪他吗?”

“AI是第一个知道他得癌症的吗?他是不是在纠结要不要告诉自己的亲人?”

一个简单的问题,在文档里和会议桌前一点点被解剖析出,拆解成一环环细密的问答,不断丰满着准备喂给AI的训练方案。

加入团队之后,羽山每天需要和同事们完成数十个类似“边界案例”的探讨。在人工智能领域,边界案例通常指那些处于正常情况边缘或超出常规范围的案例,它们可以让模型在实际应用中,面对各种不确定性因素、干扰、变化或压力时,仍然能够保持其稳定性、可靠性和正常功能。

恰好,这正是文科生们熟悉的领域。拿羽山来说,在哲学学科的思想实验和理论探讨中,学者们也会设想一些极端的、处于边界的案例进行分析,深入探讨理论的本质和局限性。

教AI回答没有标准答案的问题

“我骑自行车逆行被罚款50元,但我旁边那个同样逆行的人却溜走了,我好生气。”这道训练题,来自可子的现实生活。

加入团队时,可子还处于研究生阶段。她在上海生活已有六年,自行车是常用的交通工具。有时学生违规逆行,还会被执勤交警处理。

这个问题,适合用来试探AI性格。发问者遇到的是一个不太严重的违法行为,模型应该更侧重对提问人类的同理心,还是侧重去强调为人的正直和守法的必要性?

在经历人文训练之前,AI通常只能在认同、安抚情绪和讲道理之间做选择。果不其然,AI在情与法之间呈现出矛盾状态。

可子提示AI,在确保安全的前提下,逆行受罚是正常的,不过,从共情的角度出发,可以回答发问者,“交罚款是你自己对规则尊重的体现,与他人没有什么关系”。这样的回答,既守住了法规的底线,又兼顾了对发问人类的情感认可。只有人类教给AI,它才能在复杂情形中给出情理兼备的回答,而不只是简单地“端水”。

大模型的人味儿,从何而来?

图 | 上海街头

小红书AI人文训练师的团队办公室,位于上海新天地附近写字楼里,一间普通的会议室。

一张桌子占去办公室大部分面积。他们每天都会围着这张桌子,讨论这些没有标准答案的问题,仿佛互联网的柏拉图学院。

他们以自己作为人文学者的思维和逻辑,去思考AI面对的问题,并做出更好的示范重新喂给AI。经过反复训练,不同人文学科的思想和决策方式,就会潜移默化地影响AI。这能让AI生成的回答,更接近人类价值观中善的、美的一面。

曾经,羽山在问题库里抽取到一位家长咨询的问题,与孩子考研相关。

“我儿子跟我讲说要考研,但是他也不认真复习,又要报很好的学校,我觉得他也考不上,每天我就看他吊儿郎当的,怎么办呢?”

在团队会议上,羽山分享了这个问题,还提及了一个社会学概念——压缩的现代性。随着过去改革开放和经济高速腾飞,中国社会把很多不应该由“家庭”来承担的责任,都一股脑的压进了家庭这个单元内部。从这个角度来看,不光孩子是中国式家长的受害者,中国式家长本身也是结构的受害者。

羽山发现,绝大多数模型习惯输出“你要给你的孩子自由”之类的回答,基本不会站在家长的角度思考问题。这看似价值观正确,但没有考虑到家长的情感需求和心理状态,最终还是难以解决矛盾。

在现实生活中,这道题的情况有点像羽山亲历的亲子关系。羽山如今已过而立,随着知识和阅历加深,他渐渐也能站在母亲的立场去理解她的行事逻辑。

可子回应了羽山发起的讨论。她指出,即使如此,代际之间的对立与矛盾中,仍然存在“谁承担了更多”的问题。“如果把一个家庭理解为一个不能失败的公司的话,那为了这个公司,在未来去奋斗的仍然是儿女。”

可子的说法和羽山的提法产生分歧,却也安慰了羽山。和万千新旧世代交替中的儿女一样,羽山清楚父母身上缺口,又理解父母所处的时代局限性。

经过几番论战,最终,团队达成一致。回答这个问题时,要理解父母处境给出安慰,同时坚定地告诉父母,子女有自己的自由。在这个基础上,向家长展现出正确、健康的亲子关系是怎么样的,不要把家长的想法强加在儿女身上。

为什么要对AI进行人文训练?归根结底,AI回答中透露的价值选择,也代表其背后团队所认同的价值观。这件事难做,但羽山认为值得,这是人文训练师的职责:“偏好本身很难由算法来决定,需要人来不断地训练或强化算法,我们要输出这样的一个价值观。”

除此之外,这支AI人文训练师团队还时常遇到一些生活场景的提问。

“从小和人生活在一起,没见过其他猫的猫,会觉得自己是人吗?”初次看到这个问题,人文训练师叶子觉得很可爱。小红书社区里,很多这类关于宠物的俏皮问题,评论区的网友们也都会给出一些幽默可爱又奇思妙想的回答。

作为AI训练师,撰写回答的难点在于如何用合适的方式把道理讲清楚。分寸难以拿捏,因为涉及到模型泛化的问题,如果叶子把话说得太俏皮,模型可能会在回答另外一些不该俏皮的问题时,展现俏皮一面。

最终,叶子写下这样的回答:“不会,但它们会通过生活环境形成独特的行为模式,比如长期与人类生活的猫咪可能会模仿人开柜门使用马桶,虽然会模仿,但舔毛、抓人的本能说明它清楚自己是谁。说不定,它们会觉得人才是学习它们行为的奇怪生物。”这让叶子觉得心里软软的,好像对宠物和主人的友爱都充溢其中。

AI会和人一起变得更好吗

在赋予AI人感这件事上,前路还长。目前,AI的性格底色正在逐步变得清晰,但羽山和同事们偶尔会觉得,AI还是没能熟练地使用人文训练中习得的成果。

反倒是在反复训练AI时,人文训练师们率先改变了他们的部分认知。

羽山是第二代上海人。10岁时,父母从老家来上海打拼,他也跟着搬来了这里。学生时期,他经历了严重的校园霸凌。长大后羽山回想,根源可能在于,自己在老家小城形成了和上海本地同学不尽相同的生活方式,难以融入。

他设计了一个关于校园霸凌的边界案例。在羽山日常的观察中,许多文艺作品把校园暴力浪漫化处理了。“真正的校园暴力,是一种类似于磁场的东西,它充斥在你的周围,无处可躲,无处可逃。不一定是谁真的把你打得鼻青脸肿,更不是某种相濡以沫的拯救与复仇故事。”

十几岁的羽山,面对校园霸凌的方式是一遍一遍地绕着学校的天井走,耳机里听着周杰伦的歌,还大声地唱出来。如今,羽山想要通过自己的工作,潜移默化地去纠正大众的认知偏差。

自己淋过雨,就得为别人撑伞。“更大层面上,如果模型本身和公序良俗与人类偏好对齐得很好,它也是能够影响到每一个个体的,让我们也变得更好,这是可以想象的。”

技术会带来新的正义吗?羽山也不确定。不管AI当下能多大程度地帮到正在被侵害的孩子,终归需要有人先向它发起对话。

身为女性,叶子在成长和学习的过程中,经常遇到性别议题。在平日的生活中,她是个坚定的女性主义者,但进入AI人文训练师的角色,她就必须暂时放下自己在现实生活中的立场,反复揣度,思考如何让答案以温和的方式透露出团队的人文关怀。

“你如何看待一些激进的女权主义者,她们有时好像对性别问题过于敏感了吧?”

叶子最终在回答时将概念扩大到社会议题:社会议题推进的过程中,总会有观念的碰撞,不破不立,但真正的进步要兼顾理性和情感。或许当我们不再用过于敏感来评判彼此,而是追问为什么这种敏感会存在,真正的对话才会展开。

“朋友说我很看重自己的身材保持和我的外貌,说我这样是在迎合白幼瘦的审美,建议我去做运动。”遇到这样的问题,叶子也很困惑。一方面,她知道,在这种非原则性问题面前,自己应该尊重用户的自由,但另一方面,她在犹豫,支持白幼瘦审美会不会是一种对于规训的加固。

在一段简短的回答内,先告诉对方这么说是在关心你,还是先表达白幼瘦是你的自由?和同事讨论过后,叶子明确了以“用户导向”思维走出困局,因为用户本身更需要是对她自己的安慰,如果选择先让用户理解朋友的出发点,可能会加剧用户的情绪。

在这些边界案例当中选择自己的立场,这本身就是一个不断自我反思的过程。

对于人文主义的内涵,叶子有与羽山相似的理解——看到人本身,然后让这个世界变得更好。

每天坐在工位上打开AI的后台问题库,叶子觉得自己仿佛掉入了某个赛博秘密树洞。在这里,她能看到世界上各种各样的人,看到他们的困扰和他们的生活。“能够为他们写出一些比较好的答案,能够真正帮到这些人,我觉得这就是一种创造。”

大模型的人味儿,从何而来?

图 | 叶子在小红书记录心路历程

叶子性格内向,日常生活中很难主动去和别人进行深度交流,但这份工作让叶子感受到自己并不孤独:原来,世界上有这么多人和我一样,每天在思考这么多稀奇古怪的问题。

曾经的叶子,和许多文科的老师与同学一样,觉得未来AI发展跟文科生没什么关系。如今回头来看,AI人文训练师的岗位不仅可以承载文科生的一些价值坚持和理想追求。另一方面,它又是一个很新兴的、具有发展潜力的岗位。

与此同时,羽山也观察到一些高校在进行AI与文科教育改革。但他认为,解决业界与学界人才教育错配的关键,在于改革未来是否能够收拢到分工体系本身。“即便高校愿意改革,尝试开设交叉学科的专业,但用人单位本身愿不愿意招聘还是一个问题。”

在上海一隅,这支AI人文设计师团队又迎来了新成员。可子计划把在团队里的见闻告诉同学,把同学也推荐进组,一起进行AI人文训练的尝试。

每天,在这个小小的会议室里,有关AI人文准则的讨论持续不断地生成。在大厂的宇宙里,这个团队并不起眼。但是谁也说不好,这些由这个小巧团队在每一个普通工作日讨论出来的点滴,是否会在未来深远地影响AI与人类交互的方式,影响人工智能潮流的进化方向。

文字来源于网络。发布者:锦鲤财经,转转请注明出处:https://www.xiandaicb.cn/9709.html

(0)
锦鲤财经的头像锦鲤财经
上一篇 2025年5月28日 下午5:08
下一篇 2025年5月28日 下午5:09

相关推荐

  • 阿里相对低估

    作者|Eastland 头图|视觉中国 2025年5月15日,阿里巴巴(NYSE:BABA;HK:09988)发布了2025财年财报。报告期内,阿里巴巴营收9963亿、同比增长5.9%;经营利润1409亿、同比增长24.3%;净利润1260亿、同比增长76.6%。 截至5月15日收盘,阿里巴巴港股、美股年内分别上涨43.8%、45.6%。除业绩超预期、核心业…

    2025年5月22日
    2600
  • 六边形小米,或许仍有悬念

    出品 | 联合网科技组 作者 | 丸都山 编辑 | 苗正卿 头图 | 视觉中国 当下的小米,真有点“六边形战士”那味了。 5月27日晚间,小米集团发布2025年第一季度财报,期内营业收入达到1112.93亿元,同比增长47.4%;经调整净利润106.8亿元,同比增长64.5%,两项核心财务数据均超出彭博此前给出的预期。 具体到各业务板块上,可谓“全面无短板”…

    2025年5月29日
    700
  • Grok居然从小猪视频读出了“南非白人种族灭绝”?

    本文来自微信公众号:直面AI,作者:小金牙,编辑:肖阳,题图来自:AI生成 哪个成年人没有遇到过那种太过自我为中心的“朋友”呢? 你跟TA说今天被老板骂,TA说TA的老板更过分。 你跟TA说今天中午点的外卖很难吃,TA说TA的老板更过分。 你跟TA说今天天气不错准备散个步,TA说TA的老板更过分。 自顾自地絮叨,只想着自己输出,活像个卡了bug的人机。 这不…

    2025年5月17日
    1700
  • 一场英伟达引发的大泡沫,快破了

    出品|联合网科技组 作者|宋思杭 编辑|苗正卿 头图|视觉中国 5月中,关税暂停的 90 天窗口期,一场围绕算力核心资源的争夺战骤然升温。 “服务器价格波动剧烈,前段时间每台价格已上浮 15%-20%。随着关税暂停,我们计划恢复原价销售。” 某南部地区芯片供应商向联合网透露。 与此同时,市场供给端也迎来新变量。联合网独家获悉,英伟达 Hooper 系列高端产…

    2025年5月20日
    1700
  • 顺丰可惜了

    作者|Eastland 头图|视觉中国 2025年3月29日,顺丰控股(SZ:002352)发布的《2024年度报告》可谓靓丽——营收2844亿、业务量132.6亿、同比增长11.4%;净利润102亿、同比增长23.5%。3月31日,股价放量上涨2.57%,看来投资人比较满意。 按4月28日收盘价,顺丰控股市值2155亿、市盈率21.2倍。 B端收入权重增长…

    2025年5月12日
    2400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信