操作系统的机会属于少数人,但应用创业的机会属于很多人。
作者 | 吴炳见
windows最大的贡献是孕育了浏览器这个超级应用,浏览器最大的贡献是产生了像Yahoo Google这些超级应用,从此开启了互联网时代。信息产业变迁史,是一个价值链不断迁移和上浮的历史,所有2C产品的竞争,都是在抢夺两件事:用户的时间份额、用户的钱包份额,谁离这两件事最近,谁就是killer App,谁就能切走下层底座的价值。
GPT的出现,无疑是操作系统级别的,上面长出的第一个杀手级应用叫chat search,基于这个底座,再长出10个百度、抖音级别的应用是完全有可能的,这会带来用户时间和钱包份额的重新分配。
作为一个早期投资人,身边有很多朋友在考虑下场创业做AI应用,会找我一起讨论,选哪个向,打什么牌,这里分享下我的思考框架。
| 思考框架一:
超级应用出现和平台的新特性息息相关
从 PC 到 Mobile,大的机会是智能手机的新特性带来的,LBS 带来美团和滴滴,通讯录带来微信,camera 带来抖音和快手,voice 带来全民K歌,刷屏动作带来今日头条。
微信相比手机,新特性是通讯录扩大了百倍,通讯录里的人更多,更能点对面通讯,这种能力的增强才让拼团,分销,砍价成为可能,里面最大的应用是拼多多。
现在新一代AI带来哪些新属性?我初步想到的:
一是language,自然语言交互。之前windows Android之所以用图形化界面,本质是技术上达不到,还没法让机器听懂人话,现在可能了,基于“听人话”的交互方式。从PC的鼠标滑动到mobile的刷屏动作,猜测,未来基于自然语言的交互,会极大的缩减交互页面,绝大多数操作在一个页面完成,用大白话的指令调取各种结果,甚至一个页面调用多个App的结果。极致的简单留给用户,复杂留给后端,AI Native应用未必是App形态。PC的指标是page view,mobile的指标是日活,那么AI应用的指标可能是”调用量“。
展开全文
二是Generative,实时生成。从生成文本和代码,到图像、声音和视频,甚至未来会生成机器人的动作,生成初步的科研成果,能生成的output越来越多,复杂度越来越高。抽象来看,x轴是媒体形式(文本 声音 图像 视频),y轴是呈现形态(数字世界2D 数字世界3D 物理世界3D),z轴是行业场景(比如广告 电商 游戏 影视 编程 设计 科研 机器人...),z轴上的品类数以百计。关键是要在xyz中间取一个有效的点,才是真PMF,比如“视频-数字世界2D-广告”指向的是AI生成广告视频,“视频-物理世界3D-机器人”指向的是AI生成机器人动作。
这带来了两个变化,一是效率上十倍速,AI生成广告视频,AI编程都是相比传统方案的十倍速。二是解锁了不可能,比如过去的AI教育是无法真AI的,退而求其次的手段是穷举所有视频素材,切成片段,再靠逻辑树串联起来,现在这种真AI教育有可能了。未来的视频,极端来看,可能会出MP4 AVI之外的另外一种文件格式——基于起始的素材和当下的交互,实时生成后面的视频,而这,又会解锁很多行业。
三是多模态感知,每一种信息来源称为一种模态,AI能同时感知语言+图像+many others,input变得极为丰富。人是多模态感知的集大成者,人有听觉、视觉、触觉、嗅觉、味觉,这么多input是实时的、综合的,人才能对当下的情形做出精准判断。我们对PC的输入主要是鼠标和键盘,我们对手机的输入主要是触屏、location、陀螺仪(动作)等;AI时代,大模型可以实时感知我们的语言、图像视频,同时又囊括了PC和mobile的所有感知形式,同时感知,综合判断,开始逼近人类的感知水平。比如,我们开一个圆桌会议,通过麦克风和摄像头,对人、内容、环境的感知,就可以帮我们提炼当下的核心观点,给出一部分问题的答案,和给出提问提示,这个会议会高效很多。
mobile相比PC,因为随身的属性,以及增加了很多传感器,收集的数据量大了百倍不止。AI时代的数据量,可能会再高几个数量级,因为所有的语言和图像都成为有效input了,这里蕴藏着巨大能量,是什么现在很难说。
这是我初步想到的AI新特性,还在持续的琢磨。相信新一代AI应用,一定长在AI的新特性上。
并且,下一代智能终端的出现,大概率是被AI新特性解锁的,最有这种可能性的是AR。戴着AR,它的输入和我们眼睛耳朵的输入是同频的,它的输出可以实时生成,它的交互可以基于自然语言,AI的三个新特性解锁了AR的三个不可能。
| 思考框架二:
打明牌or打暗牌
上面讨论的是方向选择,有了方向,还得看过往背景适合打哪什么牌局。
今天任何能轻易想到的idea,都是明牌,上来就摊牌比经验值,武力值,和血条了,比如大家讨论最多的虚拟助手,虚拟老师,AI客服,文案生成等等。在这种显而易见的方向上,高手和熟手太多,只是打一张起跑早的“先手牌”很难获胜。
以AI教育为例,教育是个长链条行业,从投放,到课程运营,到教研,到销售都有成熟方法,到最后是在比”拧螺丝“的效率,这个行业的高手也很多,很多人融过1亿美金以上,管过千人团队,就差一个好的PMF可以再启程了。如果一个新手进到AI教育里,PMF刚跑通,刚准备学习下如何投放,如何管100个销售,刚准备手枪换步枪,旁边直接蹦出几个高手就拿加特林机枪给突突了。
什么是暗牌?暗牌往往是非共识,是完全0到1的产品创新,挖掘的是隐性需求,市场空间极其模糊,巨头和高手想不到或看不上。比如snapchat、Airbnb、快手、抖音、b站、拼多多、小红书,早期的时候都有点小众,能否泛化未知。2013年的时候,如果问全国人民会看30秒短视频吗,是很难有答案的。这种暗牌为早期生存赢得了几年的时间窗口,猥琐发育,等到摊牌比武力值的时候,大家手里都是加特林,对着突突一下还是有胜算的。
明牌意味着共识,往往是面向存量市场,用新方案替代老方案,十倍速是最好的武器。可能是更好的文案工具,更好的教学工具,提升的是体验和效率。
暗牌意味着非共识,往往对应增量人群,满足的是未被满足的需求,0到1的创新是最好的武器。快手抖音出来前,短视频几乎没有被验证过,是凭空造出个短视频范式。拼多多出来前,下沉人群是很少网上购物的。
如果是一个经验值丰富、善于靠商业和效率取胜的高手,上手打明牌是可以的,段位高到一定程度,还能起到吓跑清场的效果。
如果是一个经验值少、用户洞察犀利、善于创新的AI产品经理,最好还是想想暗牌,从一个很独特,非共识的切入点进入。起手打明牌是对加特林机枪的不尊重。
| 思考框架三:
每一代亿级用户的产品都基于“无意识”产品形态
有了方向,确定了打什么牌局,还得落到具体的产品形态。
AI native App的经典产品形态是什么?
PC时代的经典产品形态是黄页和搜索。
Mobile时代的经典产品形态是feed流(抖音 今日头条),timeline(微信),140字符(Twitter),二维码(移动支付)。
越是大DAU产品,产品形态越是简单,适配的人群越广,用户越容易陷入“无意识”的使用中,这才是kill time的大杀器。
AI native App也会出现经典产品形态,可能是chat形式,可能是copilot形式,经典产品形态的出现需要子弹飞一会儿。2010年mobile刚起来的时候,App有种浓烈的网页感,直到2015年前后,几个大哥级App站稳了脚跟,mobile产品的审美才开始一致起来,内容输入就学微博,内容展示就学头条,对话界面就学微信,加好友和付款就用二维码,天下文章一大抄,最佳形态就那么几种。
正确的产品形态往往四两拨千斤,而且带来跨越式发展,看一个例子:
二维码is new payment,一个二维码撬动了移动支付的普及,中国跨越信用卡到了移动支付国度,变弱为强。
同理,AI is new SaaS。未来的SaaS形态会有巨大变化,AI作为每家公司的底座,会抹平过去的很多成本:一是降低部署成本,因为结构化和非结构化的数据都接入大模型了,SaaS的部署成本会低很多;二是降低获客成本,基于大模型可能会出现app store,比如plugin的形态,营销成本会下降,更拼产品本身了;三是省去了很多长尾页面,因为交互基于自然语言,而非图形化界面了。极端来看,software将不再as a service,而是result as a service,这这里面会不会长出中国形态的SaaS?
从2010年开始做mobile产品,2013年做mobile投资,一个很大的复盘是,假如当时明白“大的应用机会是智能手机的新特性带来的”这个道理,品类选择会容易很多。
我参加过几次AI创业方向的讨论,脑暴出的创业点子可以记下三页A4纸,太多啦!这种多,很容易让创业者有种挖到金子的冲动感,在里面抓一个点子创业,等于摇骰子开大小,最好能否掉自己的5个想法后再做选择。我们必须要问自己,思考框架是什么,怎么选出有效选择。Hope PMF be with you!