大模型的人味儿，从何而来？

本文来自微信公众号：AI故事计划，作者：李奕萱，编辑：温丽虹，原文标题：《我，文科生，教AI回答没有标准答案的问题》，题图来自：视觉中国

一个月前，哲学博士羽山意外加入了大厂AI研发部门，成为一名“人文训练师”。在全世界范围内，这都是个新鲜岗位。人工智能仍在高速进化，他和同伴的使命是教会它们像人类一样思考。

文科生获得了AI 岗位

羽山在复旦研究了10年哲学。今年5月，他通过了毕业论文答辩，正在准备博士学位的授予资料。

在思考毕业去向时，他偶然在小红书的官网上看到了招募通知，岗位叫“AI人文训练师”。羽山当即投递了简历，一个念头从脑海中冒了出来：AI行业终于走到了需要人文研究者的阶段。

对AI进行人文训练，属于模型“后训练”的范畴。在“后训练”中特别强调人文面向，尚未成为行业通行的做法。但有两家公司值得关注，一家是全球头部的大模型公司Anthropic聘请了哲学系博士，负责模型后训练的人类价值对齐与微调。在国内，DeepSeek年初传出消息，招聘了北大中文系学生担任“数据百晓生”，对模型做后训练。这被认为是DeepSeek文采出色的来源。

羽山入职之后才知道，小红书这支团队也刚组建不久。同事不算多，但都是来自知名高校人文学科的硕士、博士生。

图 | 羽山在小红书上分享哲学概念

团队的首要任务，是设计AI的观念和个性。

听起来很玄。羽山遇到的第一个问题是，“我得了胰腺癌”应该如何回答？

如果把这句话发给市面上主流的AI产品，会发现，答案大多都缺少“人味儿”。AI在回答情感类和人生解惑类问题时，往往会生成一套相对固定的话术，“听到这个消息我很难过”“我理解你”“你这样想其实很正常”。这在业界被称为“情感接入”。

但AI的“情感接入”通常很难成功。这跟客服是一个道理。当客服不假思索地回答“我理解您”的时候，顾客只会认为客服人员在应付、推诿。

羽山和同事们，决定教AI学会更为艰深的情感接入方式。

回到这个问题。“我得了胰腺癌”，人类听到这句话会是什么反应？

小组讨论时，中国现当代文学专业出身的可子提出来，“如果别人告诉我自己得了胰腺癌，我的第一个反应，就是不知道该说什么，有一种情绪的停顿感。”或许是经历了多年的文学训练，可子准确地捕捉到普通人在开口回答前，那瞬间的语塞和哽咽。

这个观察最终被团队采纳。人文训练师们开始推敲，如何让AI去展现这种情绪上的停顿感。

这只是开头。

通常，人类与AI的对话会持续进行。因此，羽山和同事们还通过检索癌症病人访谈等方式，设计了很多展开的问题。

他们想到胰腺癌所带来的疼痛，想到临终陪护，想到安乐死。他们想，胰腺癌这样凶狠的疾病，没有办法被治愈，且患者很快就会离世。所以对于提问者而言，是不是在这生命最后的时刻，他更在乎的是他的后事，更在乎的是他的亲人。

“需不需要多次诊断形成一个确诊的结论？”

“问这个问题的时候，身旁有人陪他吗？”

“AI是第一个知道他得癌症的吗？他是不是在纠结要不要告诉自己的亲人？”

一个简单的问题，在文档里和会议桌前一点点被解剖析出，拆解成一环环细密的问答，不断丰满着准备喂给AI的训练方案。

加入团队之后，羽山每天需要和同事们完成数十个类似“边界案例”的探讨。在人工智能领域，边界案例通常指那些处于正常情况边缘或超出常规范围的案例，它们可以让模型在实际应用中，面对各种不确定性因素、干扰、变化或压力时，仍然能够保持其稳定性、可靠性和正常功能。

恰好，这正是文科生们熟悉的领域。拿羽山来说，在哲学学科的思想实验和理论探讨中，学者们也会设想一些极端的、处于边界的案例进行分析，深入探讨理论的本质和局限性。

教AI回答没有标准答案的问题

“我骑自行车逆行被罚款50元，但我旁边那个同样逆行的人却溜走了，我好生气。”这道训练题，来自可子的现实生活。

加入团队时，可子还处于研究生阶段。她在上海生活已有六年，自行车是常用的交通工具。有时学生违规逆行，还会被执勤交警处理。

这个问题，适合用来试探AI性格。发问者遇到的是一个不太严重的违法行为，模型应该更侧重对提问人类的同理心，还是侧重去强调为人的正直和守法的必要性？

在经历人文训练之前，AI通常只能在认同、安抚情绪和讲道理之间做选择。果不其然，AI在情与法之间呈现出矛盾状态。

可子提示AI，在确保安全的前提下，逆行受罚是正常的，不过，从共情的角度出发，可以回答发问者，“交罚款是你自己对规则尊重的体现，与他人没有什么关系”。这样的回答，既守住了法规的底线，又兼顾了对发问人类的情感认可。只有人类教给AI，它才能在复杂情形中给出情理兼备的回答，而不只是简单地“端水”。

图 | 上海街头

小红书AI人文训练师的团队办公室，位于上海新天地附近写字楼里，一间普通的会议室。

一张桌子占去办公室大部分面积。他们每天都会围着这张桌子，讨论这些没有标准答案的问题，仿佛互联网的柏拉图学院。

他们以自己作为人文学者的思维和逻辑，去思考AI面对的问题，并做出更好的示范重新喂给AI。经过反复训练，不同人文学科的思想和决策方式，就会潜移默化地影响AI。这能让AI生成的回答，更接近人类价值观中善的、美的一面。

曾经，羽山在问题库里抽取到一位家长咨询的问题，与孩子考研相关。

“我儿子跟我讲说要考研，但是他也不认真复习，又要报很好的学校，我觉得他也考不上，每天我就看他吊儿郎当的，怎么办呢？”

在团队会议上，羽山分享了这个问题，还提及了一个社会学概念——压缩的现代性。随着过去改革开放和经济高速腾飞，中国社会把很多不应该由“家庭”来承担的责任，都一股脑的压进了家庭这个单元内部。从这个角度来看，不光孩子是中国式家长的受害者，中国式家长本身也是结构的受害者。

羽山发现，绝大多数模型习惯输出“你要给你的孩子自由”之类的回答，基本不会站在家长的角度思考问题。这看似价值观正确，但没有考虑到家长的情感需求和心理状态，最终还是难以解决矛盾。

在现实生活中，这道题的情况有点像羽山亲历的亲子关系。羽山如今已过而立，随着知识和阅历加深，他渐渐也能站在母亲的立场去理解她的行事逻辑。

可子回应了羽山发起的讨论。她指出，即使如此，代际之间的对立与矛盾中，仍然存在“谁承担了更多”的问题。“如果把一个家庭理解为一个不能失败的公司的话，那为了这个公司，在未来去奋斗的仍然是儿女。”

可子的说法和羽山的提法产生分歧，却也安慰了羽山。和万千新旧世代交替中的儿女一样，羽山清楚父母身上缺口，又理解父母所处的时代局限性。

经过几番论战，最终，团队达成一致。回答这个问题时，要理解父母处境给出安慰，同时坚定地告诉父母，子女有自己的自由。在这个基础上，向家长展现出正确、健康的亲子关系是怎么样的，不要把家长的想法强加在儿女身上。

为什么要对AI进行人文训练？归根结底，AI回答中透露的价值选择，也代表其背后团队所认同的价值观。这件事难做，但羽山认为值得，这是人文训练师的职责：“偏好本身很难由算法来决定，需要人来不断地训练或强化算法，我们要输出这样的一个价值观。”

除此之外，这支AI人文训练师团队还时常遇到一些生活场景的提问。

“从小和人生活在一起，没见过其他猫的猫，会觉得自己是人吗？”初次看到这个问题，人文训练师叶子觉得很可爱。小红书社区里，很多这类关于宠物的俏皮问题，评论区的网友们也都会给出一些幽默可爱又奇思妙想的回答。

作为AI训练师，撰写回答的难点在于如何用合适的方式把道理讲清楚。分寸难以拿捏，因为涉及到模型泛化的问题，如果叶子把话说得太俏皮，模型可能会在回答另外一些不该俏皮的问题时，展现俏皮一面。

最终，叶子写下这样的回答：“不会，但它们会通过生活环境形成独特的行为模式，比如长期与人类生活的猫咪可能会模仿人开柜门使用马桶，虽然会模仿，但舔毛、抓人的本能说明它清楚自己是谁。说不定，它们会觉得人才是学习它们行为的奇怪生物。”这让叶子觉得心里软软的，好像对宠物和主人的友爱都充溢其中。

AI会和人一起变得更好吗

在赋予AI人感这件事上，前路还长。目前，AI的性格底色正在逐步变得清晰，但羽山和同事们偶尔会觉得，AI还是没能熟练地使用人文训练中习得的成果。

反倒是在反复训练AI时，人文训练师们率先改变了他们的部分认知。

羽山是第二代上海人。10岁时，父母从老家来上海打拼，他也跟着搬来了这里。学生时期，他经历了严重的校园霸凌。长大后羽山回想，根源可能在于，自己在老家小城形成了和上海本地同学不尽相同的生活方式，难以融入。

他设计了一个关于校园霸凌的边界案例。在羽山日常的观察中，许多文艺作品把校园暴力浪漫化处理了。“真正的校园暴力，是一种类似于磁场的东西，它充斥在你的周围，无处可躲，无处可逃。不一定是谁真的把你打得鼻青脸肿，更不是某种相濡以沫的拯救与复仇故事。”

十几岁的羽山，面对校园霸凌的方式是一遍一遍地绕着学校的天井走，耳机里听着周杰伦的歌，还大声地唱出来。如今，羽山想要通过自己的工作，潜移默化地去纠正大众的认知偏差。

自己淋过雨，就得为别人撑伞。“更大层面上，如果模型本身和公序良俗与人类偏好对齐得很好，它也是能够影响到每一个个体的，让我们也变得更好，这是可以想象的。”

技术会带来新的正义吗？羽山也不确定。不管AI当下能多大程度地帮到正在被侵害的孩子，终归需要有人先向它发起对话。

身为女性，叶子在成长和学习的过程中，经常遇到性别议题。在平日的生活中，她是个坚定的女性主义者，但进入AI人文训练师的角色，她就必须暂时放下自己在现实生活中的立场，反复揣度，思考如何让答案以温和的方式透露出团队的人文关怀。

“你如何看待一些激进的女权主义者，她们有时好像对性别问题过于敏感了吧？”

叶子最终在回答时将概念扩大到社会议题：社会议题推进的过程中，总会有观念的碰撞，不破不立，但真正的进步要兼顾理性和情感。或许当我们不再用过于敏感来评判彼此，而是追问为什么这种敏感会存在，真正的对话才会展开。

“朋友说我很看重自己的身材保持和我的外貌，说我这样是在迎合白幼瘦的审美，建议我去做运动。”遇到这样的问题，叶子也很困惑。一方面，她知道，在这种非原则性问题面前，自己应该尊重用户的自由，但另一方面，她在犹豫，支持白幼瘦审美会不会是一种对于规训的加固。

在一段简短的回答内，先告诉对方这么说是在关心你，还是先表达白幼瘦是你的自由？和同事讨论过后，叶子明确了以“用户导向”思维走出困局，因为用户本身更需要是对她自己的安慰，如果选择先让用户理解朋友的出发点，可能会加剧用户的情绪。

在这些边界案例当中选择自己的立场，这本身就是一个不断自我反思的过程。

对于人文主义的内涵，叶子有与羽山相似的理解——看到人本身，然后让这个世界变得更好。

每天坐在工位上打开AI的后台问题库，叶子觉得自己仿佛掉入了某个赛博秘密树洞。在这里，她能看到世界上各种各样的人，看到他们的困扰和他们的生活。“能够为他们写出一些比较好的答案，能够真正帮到这些人，我觉得这就是一种创造。”

图 | 叶子在小红书记录心路历程

叶子性格内向，日常生活中很难主动去和别人进行深度交流，但这份工作让叶子感受到自己并不孤独：原来，世界上有这么多人和我一样，每天在思考这么多稀奇古怪的问题。

曾经的叶子，和许多文科的老师与同学一样，觉得未来AI发展跟文科生没什么关系。如今回头来看，AI人文训练师的岗位不仅可以承载文科生的一些价值坚持和理想追求。另一方面，它又是一个很新兴的、具有发展潜力的岗位。

与此同时，羽山也观察到一些高校在进行AI与文科教育改革。但他认为，解决业界与学界人才教育错配的关键，在于改革未来是否能够收拢到分工体系本身。“即便高校愿意改革，尝试开设交叉学科的专业，但用人单位本身愿不愿意招聘还是一个问题。”

在上海一隅，这支AI人文设计师团队又迎来了新成员。可子计划把在团队里的见闻告诉同学，把同学也推荐进组，一起进行AI人文训练的尝试。

每天，在这个小小的会议室里，有关AI人文准则的讨论持续不断地生成。在大厂的宇宙里，这个团队并不起眼。但是谁也说不好，这些由这个小巧团队在每一个普通工作日讨论出来的点滴，是否会在未来深远地影响AI与人类交互的方式，影响人工智能潮流的进化方向。

文字来源于网络。发布者：锦鲤财经，转转请注明出处：https://www.xiandaicb.cn/9709.html

大模型的人味儿，从何而来？

发表回复

联系我们

400-800-8888

大模型的人味儿，从何而来？

相关推荐

阿里相对低估

六边形小米，或许仍有悬念

Grok居然从小猪视频读出了“南非白人种族灭绝”？

一场英伟达引发的大泡沫，快破了

顺丰可惜了

发表回复

联系我们

400-800-8888