文 | 周鑫雨
编辑 | 苏建勋
“今天好想你,想见见你。”一名用户在对话框中敲出了这句话。
“真的嘛?好想见你哦。”一位名叫小婉的女生随即回复,还发送了一个卖萌的表情包和一张自己的大头照。
这个用AI生成的虚拟角色“小婉”,引得不少路人驻足观望。小婉的背后,是阿里云新发布的AI个性化角色生成平台“通义星尘”——当然,她只是云栖大会上AI应用成果的一个缩影。
2023年10月31日-11月2日举办的阿里云云栖大会上,不少大中型厂商都交出了阶段性的AI应用答卷:高德地图上线了智能店铺选址功能;OA厂商蓝凌推出了AI办公助手“蓝博士”。一口气发了8个领域的应用模型的阿里云,也急于广发构建AI应用的“英雄帖”,自己率先在数字人、个性化角色生成、编程等场景给应用打了样。
2023云栖大会。图源:作者拍摄
此前,阿里大文娱团队的AI写真应用“妙鸭相机”在C端已经掀起了一波热潮。妙鸭的出圈让大家摸索到了AI应用落地的一些方向:场景聚焦,功能精简,使用方法足够傻瓜。
在阿里云、创新工场、零一万物和36kr主办的AI创客松上,具有开发者、学校、传统行业等不同背景的18只团队,利用两天的时间展示了不同的AI应用探索成果。在11月2日的Demo Show上,有人直接用大语言模型,让手机应用中的赛博财神做占卜和心理咨询。还有人用模型训练了能够模仿真实宠物行为的AI猫咪,解决无法养宠人群的情感陪伴需求的同时,还能为现实动物打造虚拟IP。
Create AI创客松。图源:作者拍摄
但在占地3.5平方公里、汇集200多家企业参展的云栖小镇暴走三天,能明显感受到:AI大模型仍然在卷产业落地,参展的AI应用场景同质且碎片化。一名大会第二天下午就打算打道回府的投资人对36氪开玩笑:“十个AI应用里面,五办公Agent(智能体),三AIGC,还有两成是回春的数字人。”
这或许也是如今中国AI应用现状的一个缩影:办公Agent、AIGC等生产力工具是最为明确的落地场景,
不过,AI赛博财神、云养AI宠物等应用的出现也侧面说明,用户体量庞大、场景碎片化的中国,是培育丰富垂类应用的肥沃土壤,碎片化的需求和小场景中能诞生不少机会。
AI应用,要么解放双手,要么让人开心
无论是云栖参展的厂商,还是参加创客松的初创项目,都将AI应用落到了以下三个场景:文娱社交、营销、生产力工具。
文娱社交
不少人判断,“*手级”的AI应用会诞生在文娱与社交场景。在云栖会场,文娱与社交类的应用也引发了最热烈的反响。
用印有小猪佩奇、爱心等图案的积木套装迅速捕获观众注意力的“AI手办故事会”,在人机交互形式上做了新文章。
“AI手办故事会”。图源:作者拍摄
参加Demo Show之前,“AI手办故事会”团队已经在宾馆里焊了两天的芯片——他们也是唯一一支将积木作为人机交互界面的参赛初创团队,初衷是“寓教于乐”。“AI手办故事会”将prompt封装进印有不同图案的积木。孩子只要随意拼装积木,设备就能生成不同的故事,并用语音播放。
近期已经参加了8场黑客松的“社交骇客”团队想做的,则是一个“跨平台的‘陌陌’”。团队用爬虫的形式获取了小红书等不同社交平台的用户贴文等公开数据,利用大模型的内容理解能力进行分析,从而推测出不同用户的性格、职业等信息,进而实现好友匹配。
经过由25个AI NPC组成的“斯坦福小镇”的验证,游戏场景也成了AI应用落地的大热方向。阿里云此次推出的个性化角色创作平台“通义星尘”,可以根据预制角色设定Prompt,自动生成能够模仿历史人物、名人、IP互相交互的AI Agent。
通义星尘生成的侦探推理游戏。图源:作者拍摄
但单纯的对话场景并非阿里云想要发力的方向。据工作人员介绍,通义星尘未来希望与游戏厂商合作。传统的NPC只能根据预制会话做出反馈,但接入大模型后,涌现智能的NPC不仅能够像真人一样在游戏世界观中与玩家社交,还能发展新的副本剧情。
营销
其次,在降本增效的行业背景下,营销已经成为AI应用落地最为明晰的方向。围绕“买”和“卖”的过程,AI应用均有落地。
比如,“KeepChat”团队在Demo Show上拿出的是一个上来就能称呼你为“小宝”的AI销售。
与传统预制好对话的智能销售不同,KeepChat针对完整的销售流程和客户需求,在AI销售背后接入了4个Agent进行协作:Selection Agent负责挖掘用户的需求,Collection Agent和Negotiate Agent负责筛选出用户需要和感兴趣的产品信息进行推荐,Emotional Agent负责提供多样化的情感服务,提高转化率。
“KeepChat”。图源:作者拍摄
生产力工具
最后,无论是对大厂,还是对创业公司而言,用AI做生产力工具是最热门的方向。做AI工具的优点已经无需赘述:只要好用,用户付费意愿就高;落地在特定任务场景,调优所需数据量小,还能减少大模型一本正经胡说的幻觉问题。
AIGC依然是创作行业的热门方向。比如在Demo Show环节,共有三支队伍瞄准了视频制作赛道。
得了最具实用性奖的“DramaGo”团队,做的是用长文本驱动微电影的生成。与大多采用“一句话”驱动AIGC的产品不同,表意更为精确的长文本prompt在专业领域是热门的研究方向。但由于含噪量高、数据来源多样等问题,长文本的处理一直是难点。
为此,“DramaGo”引入了一个序列标注模型TagPrime来去除噪音,做文本关系的抽取。与此同时,创作团队的想法在创作的过程中也会不断调整改变。为了让AI生成的剧本能够实时跟上创作团队的思路,“DramaGo”在模型中接入了一个RTA(全称 Real-Time API),通过自动对创作团队线上会议的内容反馈的决策进行理解和梳理,自动对原有剧本进行修改。
“DramaGo”。图源:作者拍摄
南京大学的团队“一千零一夜”则用上海档案馆“闲置”的经典老电影数据对通义千问进行了调优,搭建了一个可以用不同角色做电影二创的平台。
更进一步,这些基于人物设定、台词、行为训练而成的演员和角色AI Agent(智能体),还能创造出新的社交互动玩法。在“一千零一夜”的展示环节,能看到上世纪的电影演员王人美、袁牧之和郑君里,出现在同一个群聊中的神奇场面。
“一千零一夜”。图源:作者拍摄
也有团队想用AI工具,攻克学术、技术难题。哈尔滨工业大学航天学院团队“黎曼智能”一上来就大胆地想解决ChatGPT都犯难的数学问题。数学逻辑和语言逻辑有本质的不同,团队将解题的体系分成了几个不同的推理子模型,分别为“已知命题”“待证命题”“定义”“公理”“定理”等。每次解题的过程,这些用特征向量标记的步骤就会形成一个推理数,直至解题。
而来自清华的团队“ChatCPU”则直接构建了一个提高芯片生产效率的AI Agent。芯片生产流程十分复杂,尤其在人才短缺的背景下,“ChatCPU”通过构建可以对Design Specification(设计规格书)和RTL代码(寄存器传输级,用于描述电路功能和行为)撰写等芯片生产知识进行分享的Agent,解决芯片厂商的用人难题。
“ChatCPU”。图源:作者拍摄
基于积累了十多年的门店、客流数据,加之零售行业的计算模型,高德地图在云栖上带来了面向B端的地面零售功能,通过AI帮商家进行店铺选址、铺货方案规划、访销方案规划。
当客户用自然语言向智能助手提问“我想在朝阳区开一家咖啡店,怎么选址?”高德用几分钟的时间就给出了三里屯SOHO、长楹天街等三里屯热门商圈的评估分析。
高德地图的地面零售解决方案。图源:作者拍摄
当然,一些老应用搭载大模型后,在文娱社交、营销和生产场景都有了新的玩法。
最显而易见的是,在元宇宙风口中几经浮沉的数字人,这一波又搭上了大模型的快车。不少厂商将内容理解能力跃升的大模型,接入了数字人的形象语音生成、行为生成的过程中——明显的改变是:数字人变得更聪明,还能低成本批量生产。
在多模态大模型技术发展的初期,阿里云XR实验室就乘势将跃进的多模态内容理解和生成能力,接入了数字人。按照传统的CG制作流程,一个数字人需要花费2-3个月和100-200万元,而使用大模型后,据现场工作人员介绍,交付成本分别变成了几个小时和7000元。
除了最热门的商家直播、政务文旅宣传等营销和生产场景,数字人制作门槛的降低和智力的提升,也让一些厂商开始探索新的文娱落地方向。
比如成立于2021年的元宇宙空间厂商“秋果计划科技”,在云栖大会上将可定制形象的数字人搬进了智能音箱,瞄准的是家庭陪伴场景。在网易的手游《逆水寒》中,玩家只要上传人脸照片,系统就能自动生成相应的数字人角色形象,用手机就能捏脸调整。
“秋果计划科技”推出数字人智能音箱。图源:作者拍摄
“*手级”难出,小场景先行
值得注意的是,曾经的“C端顶流”妙鸭相机,开始试水To B业务。
想要做出比肩微信、抖音这样场景足够广阔、生态足够复杂的“*手级”AI应用,除却底层模型能力的掣肘,企业——尤其是初创公司——还不得不面临高昂的推理成本。
即便9.9元的写真价格比动辄大几百的实体照相馆便宜许多,云栖不少前来试用的观众仍然对收费不满,妙鸭的工作人员需要不断解释:AI生成写真需要消耗不少算力,所以收取一定的费用。
妙鸭相机。图源:作者拍摄
B端成了AI应用增收的“解药”。即便是“To C顶流”妙鸭相机,仍然免不了在B端扩大盈利空间。工作人员告诉36氪,妙鸭目前正在和不少B端机构尝试员工证件照生成的业务。
但并非所有AI厂商都有B、C端两手抓的能力。在云栖的论坛上,聆心智能CTO郑叔亮对推理成本做了一个分析:若是国内10亿的用户每天花一两个小时在AI应用上,企业日均就要跑一亿张显卡。在算力短缺的大背景下,他得出一个略显悲观的结论:近两年内,国内难出“*手级”的AI应用。
除却推理成本的显示考量,能明显感受到,经过近一年的观察探索,行业对AI的应用落地不再是狂热的追捧,而是有了更多冷静和理性的思考。
AI应用中,AI的价值到底在哪里?这是Demo Show上,不少项目被投资人Challenge的点。
参加Demo Show的“Prompt Labs”开发了一款“AI版谁是卧底”,玩家可以上传自己感兴趣的文本、图片、视频,游戏可以据此生成相关的词语。但最后,“Prompt Labs”自我否定了这个功能,毕竟没有AI,谁是卧底也能照样玩。
“Prompt Labs”开发的谁是卧底游戏。图源:Prompt Labs
挖掘“真需求”,才能让AI更有价值。Moka创始人李国兴在论坛上举了AI办公助手的例子。目前AI助手能够根据会议生成一份总结摘要,但在现实情境下,不同职责员工对会议的关注点不同,会议纪要也不一样。这也意味着,不少AI办公助手的功能和现实需求存在脱节。
再比如今年回春的数字人行业。接入大模型为不少数字人厂商续了一口气,但除了更智能、更便宜,AI仍然没能扩展数字人落地的场景。“我们就是想来看看阿里会怎么做,抄抄作业。但阿里好像也没给出答案,去年到今年没有变化。”一名参会的数字人产品经理对36氪直言。
在业务中形成数据闭环是投资人和厂商们强调的第二点。
“没有数据闭环,意味着AI应用仍然是单点功能,既无法产生更大的服务价值,也没有办法在复杂的闭环场景中打磨基础能力。”高德的一名工作人员告诉36氪。
对于店铺选址场景而言,AI训练不仅需要地段客流量、周边环境等前期数据,还需要根据企业入驻后的业务数据反馈不断进行调优。但高德工作人员坦言,由于商业隐私等伦理问题,目前高德地面零售还难以填补企业业务数据的缺口。
但正如年初落后于OpenAI时,那个提振AI行业信心的判断所说的那样:中国最不缺的是应用场景。即便再细分的需求和场景,也蕴含着商机。一名投资人告诉36氪:“中国的利基市场,就已经意味着十万级以上的潜在客群。”
这也意味着,从小场景切入,AI应用还存在广阔的市场空间。
欢迎交流!