ChatGPT 爆发的那几个月,有一个明显的趋势:
在 Twitter 上,一些挂着 NFT 头像、名字结尾是 .eth 的老师,纷纷把名字结尾改成 .ai 或者 .gpt(不过头像还没来得及换),分享的内容也从 Web3 转为 AI。
咱搞开发的也差不多——不过要稍微慢一拍,毕竟要写代码的。我关注的独立开发者们,十有八九都开始搞 AI 相关的开发了,其中十有八九都是 ChatGPT 客户端和 AI 数字人。
Pando 团队也类似,于是这段时间里做了这么一些东西:
第一个项目是:i18n-cli
这是一个用 OpenAI 来翻译程序里的文案的小工具。使用简单,对准代码里的 JSON 格式的 i18n locales 文件跑一遍,然后人工看看有没有什么大问题就行。
自从用上了它,我们一个新功能完成以后,同步七个语言的翻译大概不到一分钟。
第二个项目是:tokenizer-go
无论是基于 LLM 做付费服务,还是自己评估使用 LLM 的成本,都需要算好 token 的费用。
调用 LLM 的计费方式是按照 “token” 计费的,简单理解就是文字的计量单位。但是这个计量单位算起来比较麻烦,与字符之间没有固定的兑换关系。OpenAI 官方不提供 golang 语言的 token 计算工具,当时第三方的工具里也没有支持中文的,因此我们自己写了一个。
不过热点技术的发展确实快,没过多久,就有了更好的 golang 实现 tiktoken-go。
第三个项目是:Botastic
在研究 AI 能力的过程中,我发现总有一些事情,属于那种,只要你做 AI 相关的业务,那基本上都要做一遍。那不如就交给一个框架做好。
所以,就有了 Botastic,并且提供了 SaaS 版本的 Botastic API 服务。
后续我们的所有实践都是在 Botastic 上进行的了。
第四个项目是:PAL9000
这是一个客服机器人。客服是最容易想到的 AI 场景之一,独立开发者们也卷得厉害。
当然 PAL9000 要满足我们自己的需求:能把 IM 软件作为交互界面。现在它支持 Mixin Messenger,Telegram 和 Discord。
其他小项目
基本都是 AI 数字人,包括 问问 V 神,问问 Scott Alexander,问问 @Bitrun,问问老猫。
要把 AI 做到什么程度
必须承认两个人类弱点:喜新厌旧和追逐热点。公司也是这样,在公司和团队里,会经常观察到:
- 做任何新技术的原型系统,都让人激动
- 相比制定稳妥的路线图,我们更容易陷入新技术和概念的炒作中
至于结果到底是「抢占了宝贵的时间窗口」还是「吃屎都赶不上热的」还真不好说。
作为公司或者团队的领导者,时间当然是最宝贵的生产资料。既然「 AI 必须做」的方向已经确定了,那么「做到什么程度」这个目标也得明确下来。
下面是我的一些经验: