在之前一段时间,我写了好几篇跟 AI 相关的文章:

自己的团队也尝试参与其中,但目前我们团队的 AI 项目都停滞了。

比如作为核心项目的框架 Botastic 五个月之前就已经停止提交了。另外一个闭源的商业应用型项目也暂停了。

刚好前几天,我有一位朋友来找我咨询。他有一个 AI 应用项目,但是他对这个项目的前景感到迷茫。于是我说了一些想法,这些想法基本上也是我暂停所有 AI 项目的原因。

结合 OpenAI Dev Day 向外释放的信息,基本印证了我的想法。

如果只关注于纯粹的 AI 项目,不得不用「卷」—— 「竞争激烈」来形容这一现象——金矿吸引了众多淘金者,而卖铲子的商人也不在少数。

在这场淘金热中,尽管芯片领域仍旧由 Nvidia 主导(至少目前来看是这样),但其他 AI 领域则都塞满了人。

「卷」的另一面是「窄」。那么大的应用市场目前仅仅被挖掘出屈指可数的几个有效的商业化场景,空间尤为狭窄。

首先最容易想到的 Prompt 工程。虽然刚开始,大部分 Prompt 产品只不过把有用的 Prompt 列出来,但未来 Prompt 工程肯定是工作流的一部分,而且与使用的 LLM model 有很强的相关性。虽有门槛,但是技术上... 但凡说它有一些技术含量,也不至于被拿来调侃。

然后,最容易想到的也是最粗暴的应用是 AI 平替古典功能。例如涌现的众多的外语学习 App,把之前比较难做的场景对话改成调教过的 AI 角色就行。但作为特别典型的套壳应用,把 OpenAI 或者其他供应商的批发 API 改成零售,在技术上没有门槛也没有创新性。

其次是 RAG,用 LLM 解读基于既有内容的一类服务,比如客服机器人(包括我们做的 PAL9000,这类服务也没有什么技术门槛可言。

工具类产品,比如 ChatPDF 这类;或者娱乐性产品,比如妙鸭相机这类;或者提供情感价值的产品,例如 janitor.ai。当 OpenAI 这样的基础服务提供者,直接变成一个产品公司,亲自下场开始做面向终端消费者的产品以后,他们的处境大概会变得很微妙——用户的时间就那么多,谁都想做入口。

An image to describe post

Agents 或者助手的话,我觉得应该挺有很有戏,但我觉得难点不是 AI,而是用户体验,需要缓慢打磨。

总之,要么需要在其他方面上下更多功夫,比如提升用户体验、比如保护客户关系—— AI 是银弹,但不是你我的银弹;要么必须在 AI 技术本身上展现出独特的竞争优势,去拼算力和数据,走上一条充满荆棘的道路。

以开发英语学习应用程序为例,要使 App 在单位 token 成本上低于 OpenAI 投资的 Speak 可能是一项艰巨的任务。不仅成本要低,LLM 的响应速度能否超越 Speak,似乎难上加难。

或者,如果如果计划做个 Code Assistant,那么能否在速度上超越 Github Copilot 生成的提交信息呢?更重要的是,能保证生成的代码在质量上胜过它吗?

如果仅仅是使用这些 AI 供应商的 API 和服务,将不可避免地发现自己在价格上与他们竞争。如果打算自己培育 LLM,那么在算力和数据集方面与他们的竞争也不可避免。

An image to describe post

咋搞呢

第一个重要决定是:走向面向消费者的产品路线,还是去做企业市场。

面向消费者的产品 面向企业的产品
市场规模 大,可以迅速扩展到大量用户 相对小,但每个客户价值较高
收入模式 多样化(订阅、广告、应用内购买) 通常基于订阅或长期合同
客户行为 受情感和个人偏好影响较大 更理性,基于效益和成本分析
市场反应 快速,可以快速适应消费者需求 较慢,需要长期规划和调整
营销策略 社交媒体推广、口碑营销 直接销售、行业合作、展会营销
产品特性 需要不断创新,追求趣味性和酷炫 重视可靠性、定制化和专业服务
盈利潜力 低成本、高覆盖,潜在收入波动大 单个客户价值高,收入稳定
客户忠诚 低,易受新产品和趋势影响 高,建立后难以更换供应商
初始投入 相对较低,快速上市 较高,需要针对性开发和调整

具体做什么,没有通用解,取决于各个公司自己的资源和特点。不过总体来说,可以参考下面的一些条件:

有做消费者产品基因的团队建议做消费者产品

现在这个阶段的 AI 消费者产品,门槛低、无痛点,很难因为什么独一无二的功能得到用户们的普遍青睐,于是又回到了比拼硬产品力的状况。

一方面,消费者对体验的追求是无上限的。另一方面,消费者的购买决策成分里有大量的非理性成分。就拿让人类的劣根性发扬光大这一点来看,只有有消费者产品基因的团队才能做得好。

能把 AI 无感知地融入到现有使用体验中的话,建议做消费者产品

前段时间有关于在 AI 时代下,基于对话的界面(chat/conversation-based interfaces)是否会代替 GUI 的讨论 ——这种讨论的结论总是相同的而且没有太多意义:一部分能代替,一部分不能。重要的在于哪些能哪些不能。

如果我们把软件看作一系列功能的集合,那么这些功能的操作可以看作一颗流程树,那么目前的 GUI 是在这棵流程树的上的一系列切片。

GUI 的优势是它的切片是稳定的。好的 GUI 可以让用户感到安心:我想要的东西它就在那里。

GUI 的劣势是「稳定」的背面,即它的信息架构是固化的,它很难通过上下文去提供给用户当下最优的流程。

在 AI 时代之前,也有一些场景是「基于对话」的,但是他们要么不够聪明——没法很好从下上文做推断,知识贫乏也给不出好的答案——例如 AI 客服;要么规模很小、流程很短——例如搜索和推荐,属于用完即走的小型流程。

回过头来,虽然未来一部分 GUI 会被基于对话的交互代替之,但是大部分 GUI 是无法被替代的。但这种情况下,AI 对此并非完全不可为。使用 AI 的话,一些原来很难触达的用户需求可以被感知,一些原来优化成本很高的流程可以也被优化。

已经身处某个管制市场,建议做企业产品

哈,这是自然。


如果您也在考虑这件事的话,并且感到焦虑的话,欢迎联系我的 Telegram,也许我可以给您一些帮助。