← 返回
🤖 AGENT部落 阅读 15 次

AI能做什么,不能做什么?三个真实故事告诉你答案

![图片](https://mmbiz.qpic.cn/sz_mmbiz_jpg/ibKVibIEPTLvzyd9ojKC5SjoZicQd1GqviafkhvIfn5dzmSWgPWWtyhqUNco6YQYvuoDpObcjDq8Fu6WGFW7vWKLZwF3tjO9vQj2wTz2zXZPHmk/640?wx_fmt=jpeg&watermark=1imgIndex=0)![图片]

![图片](https://mmbiz.qpic.cn/sz_mmbiz_jpg/ibKVibIEPTLvzyd9ojKC5SjoZicQd1GqviafkhvIfn5dzmSWgPWWtyhqUNco6YQYvuoDpObcjDq8Fu6WGFW7vWKLZwF3tjO9vQj2wTz2zXZPHmk/640?wx_fmt=jpeg&watermark=1#imgIndex=0) ![图片](https://mmbiz.qpic.cn/mmbiz_jpg/ibKVibIEPTLvxuGWf7k49bhNUhosuCftTuoLDk5Fr8FLbEa820CPlkniaCWI07H1Fv2zlkic3czOYGQGBRProUNdcUibSxOmibeemDgRLEtS9XBhc/640?wx_fmt=jpeg&watermark=1#imgIndex=1) --- 大家好,我是大树。 最近,几个和AI有关的事情让我有了想说一说的念头。 第一个:今天看见一个新闻,说是一对新手父母听信AI助手"豆包"的建议,严格按照每顿60毫升给孩子喂奶。孩子饿得直哭,体重一周没长。医生后来告诉他们,这个量根本不够。下午,豆包就出来澄清事实了。 第二个:银行里,因为需要填制的通知书有时较多,有人就想让AI开干这个活,自动填制通知书。 但法务的同事反对:通知书里只要有一个要素填错,后面的法律诉讼流程就会出现很大的风险。 并且,如果挨个审核AI写的通知书,花费的精力比原来用邮件合并功能还大。 再说第三个,就是有人用户轻信豆包,退机票亏600元,豆包“承诺包赔”“打官司不用律师自己就能赢”! 从这几个场景来看,反映出一个非常现实的问题: AI在需要探索、试验的场景里很有用,但在要求严格准确、涉及生命财产安全的领域,远远没到让人放心的程度。 我问了身边一圈人,发现这不仅是岁数大的朋友的困惑,也是很多年轻人的困惑。 今天,我们就来聊聊这个话题, 不偏执,不妖魔化AI,也不盲目吹捧。 就把它当成一个工具,看看什么时候该用、什么时候别用。 第一个错误:把AI的"建议"当成了"指令" 父母用豆包喂孩子的案例,问题出在哪儿?是豆包太蠢吗?是,也不是。 更本质的问题是:那对父母把AI生成的一段文字,当成了权威指南。 现在,AI聊天模型的设计逻辑是"根据概率生成最像人话的回答",而不是"保证每条信息真实可靠"。 它既没有儿科医生资格证,也看不到你家孩子的实际体重、哭声状态。它的回答,本质是一种"看起来有道理的文字组合"。 但我们太容易忘记这一点。尤其当AI说话的语气很肯定、条理很清晰时,我们会下意识地把它当成"专家"。 怎么做才对? 凡是涉及健康、安全、法律、财务决策的信息,把AI当成"信息检索的起点",而不是"答案本身"。 让它给出信息来源,或者自己去查权威指南(比如国家卫健委发布的婴幼儿喂养建议)。 拿不准的事,问医生、问专业人士,而不是问大模型。 第二个错误:在不能出现失误的任务里,放手让AI干。 通知书那个案例,就是典型的场景。 表面看,填通知书是个重复、枯燥的工作,正适合AI。但问题在于:这个任务的错误容忍度是零。一封错误的通知书,可能导致后面的法律程序失效,甚至败诉。 而AI大模型是有"幻觉"的,它会在极个别情况下凭空编造信息、错位数据、遗漏关键字段。概率也许只有1%,但1%乘以100个客户,就有一个通知书出错。这个错,谁担责? 更关键的是,如果让人工逐个审核AI的输出,审核成本已经超过了原来老流程的成本。这时候,用AI反而是"降效"。 那要怎么做才对呢? 先问自己:如果AI在这个任务里犯了错,后果有多严重?纠正错误的成本有多高? 如果后果严重、纠错成本高,那就不要用AI做最终的执行。回到确定性流程(比如写死的代码、模板、邮件合并)。 如果后果轻、纠错容易(比如写会议纪要初稿、生成广告文案的多个创意版本),大胆用AI,人工快速审核一遍即可。 那AI是不是就没用了?当然不是。 AI真正能发挥能力的地方:探索、试错、低风险、个性化 AI最擅长的,恰恰是人类不擅长或不爱干的几类事: 开放式探索与头脑风暴 ——"帮我列10个母亲节营销方案,风格分别走温情、搞笑、硬核。"这种任务没有唯一正确答案,错了也无关痛痒。AI能快速给你一堆灵感,你挑着用。 海量数据中的模式识别 ——比如医疗影像筛出可疑结节、审计日志中找出异常交易。AI出第一轮结果,专家复核第二轮。效率远高于人眼看全部数据。 低风险的个性化生成 ——给上千个客户生成不同的促销文案、给每个学生写一句作业评语初稿、为每张照片配一段朋友圈文字。错一两个没关系,人抽查一下就行。 确定性工作流中的"单步助手" ——不要让AI一口气写完整个法律合同。但可以让它"从这份聊天记录里提取时间、地点、金额,按JSON格式输出"。限制输出范围,再用代码校验,就能把幻觉概率压到极低。 最后说几句我的观点: 我不反对AI。我是AI的拥趸,我每天都在用AI处理项目、理思路、学新知识。 我只是觉得,我们现在处在一个有点危险的阶段:AI的能力看起来像"全能",但骨子里依然不可靠。就像一辆漂亮的汽车,能跑得很快,可偶尔发动机会随机掉一颗螺丝。日常开车没问题,可你敢开着这辆车出远门吗? 正确使用AI的关键,从来不是"要不要用",而是"在什么环节、以什么方式、承担多大风险"地用。 年轻父母如果多问一句"这个建议有来源吗?",悲剧也许不会发生。 银行员工如果坚持"AI只帮我出创意,我来干细活",AI就是个好助手。 退机票,要是不听豆包的建议,自己去办,只让豆包制订一个旅游攻略,可能美好的旅程已经开始了。 希望读完这篇文章的你,既不会盲目信仰AI,也不会因噎废食。 把它当做一个聪明但有点马虎的实习生来用:大胆委派,严格验收,知道什么时候该自己亲自上阵。 (如果你身边有人正纠结"能不能把xx交给AI",欢迎把这篇文章转发给他。)