ChatGPT 爆发的那几个月,有一个明显的趋势:

An image to describe post 我们团队的 AI 实践:探索过去几个月的时髦科技

在 Twitter 上,一些挂着 NFT 头像、名字结尾是 .eth 的老师,纷纷把名字结尾改成 .ai 或者 .gpt(不过头像还没来得及换),分享的内容也从 Web3 转为 AI。

咱搞开发的也差不多——不过要稍微慢一拍,毕竟要写代码的。我关注的独立开发者们,十有八九都开始搞 AI 相关的开发了,其中十有八九都是 ChatGPT 客户端和 AI 数字人。

Pando 团队也类似,于是这段时间里做了这么一些东西:

第一个项目是:i18n-cli

这是一个用 OpenAI 来翻译程序里的文案的小工具。使用简单,对准代码里的 JSON 格式的 i18n locales 文件跑一遍,然后人工看看有没有什么大问题就行。

自从用上了它,我们一个新功能完成以后,同步七个语言的翻译大概不到一分钟。

第二个项目是:tokenizer-go

无论是基于 LLM 做付费服务,还是自己评估使用 LLM 的成本,都需要算好 token 的费用。

调用 LLM 的计费方式是按照 “token” 计费的,简单理解就是文字的计量单位。但是这个计量单位算起来比较麻烦,与字符之间没有固定的兑换关系。OpenAI 官方不提供 golang 语言的 token 计算工具,当时第三方的工具里也没有支持中文的,因此我们自己写了一个。

不过热点技术的发展确实快,没过多久,就有了更好的 golang 实现 tiktoken-go

第三个项目是:Botastic

在研究 AI 能力的过程中,我发现总有一些事情,属于那种,只要你做 AI 相关的业务,那基本上都要做一遍。那不如就交给一个框架做好。

所以,就有了 Botastic,并且提供了 SaaS 版本的 Botastic API 服务

后续我们的所有实践都是在 Botastic 上进行的了。

第四个项目是:PAL9000

这是一个客服机器人。客服是最容易想到的 AI 场景之一,独立开发者们也卷得厉害。

当然 PAL9000 要满足我们自己的需求:能把 IM 软件作为交互界面。现在它支持 Mixin Messenger,Telegram 和 Discord。

其他小项目

基本都是 AI 数字人,包括 问问 V 神问问 Scott Alexander问问 @Bitrun问问老猫

要把 AI 做到什么程度

必须承认两个人类弱点:喜新厌旧和追逐热点。公司也是这样,在公司和团队里,会经常观察到:

  1. 做任何新技术的原型系统,都让人激动
  2. 相比制定稳妥的路线图,我们更容易陷入新技术和概念的炒作中

至于结果到底是「抢占了宝贵的时间窗口」还是「吃屎都赶不上热的」还真不好说。

作为公司或者团队的领导者,时间当然是最宝贵的生产资料。既然「 AI 必须做」的方向已经确定了,那么「做到什么程度」这个目标也得明确下来。

下面是我的一些经验: