大家好,好久不见啊,昨天我的Long Audio IOS APP长时间录音小工具上架IOS STORE了,一次审核通过,可惜可贺。虽然是个小工具,但是意义重大啊,因为我根本不会IOS的Swift开发,全程是在AI工具的帮助下开发的,耗时两个月,断断续续,下面我来介绍一下这个工具的开发历程吧。
灵感来源
自从AI agent能够使用之后,AI Coding的能力大幅上升,于是我就琢磨着是否能够开发小工具了。太复杂的我也不会,于是就选择小工具试下了。
额,其实这是我第2款IOS工具,但是第一款的工具设想实现比较复杂,出现了N个BUG,调整起来痛苦万分,于是暂时搁置了,就想到录音小工具了。其实需求的话,也是问了chatGPT有没有什么值得开发的小工具,不复杂,没有用户体系,没有服务器,完全在本地。于是chatGPT给了好几个想法,我挑选了录音工具,又问了有哪些痛点,最终选择了长时间录制这个小功能点。
惊喜的Demo
最开始,我根本不了解里面的技术细节和路线,就是按照ChatGPT给的描述需求,用TRAE的Claude4模型开发,仅仅一天,仅仅初版,Demo就弄好了,非常快,纯粹看外观的话,就已经定型了!看起来只需要小修小补了,但是事情远没有这么简单。
一波三折
技术路线
原本我根本不了解音频的技术,需求是ChatGPT给的,它上来就给我弄了PCM32bit的录音模式,结果导致音频文件非常大,根本支撑不了那么长时间录制!后来要求到PCM16bit,还是不行, 还是非常大,最后弄aac模式,才符合要求。
我本来想是提供给用户这3种编码模式,发现现在的工具,完全无法把他们融合在一起,不是这里出BUG,就是那里出BUG。最后在ChatGPT的建议下,无奈砍掉需求,只保留AAC模式!
单声道与多声道
原本的需求里是有多声道的,但是IOS录制默认就是单声道,根本不支持多声道,要实现只能外接耳机,根本不可行,无奈砍掉需求!
BUG
自从决定了使用AAC录制模式后,经过ChatGPT的建议,选用ADTS裸流录制,然后转成m4a,也尝试过直接录制m4a,但是无法保证意外关闭APP音频不丢失这一绝对不可更改的需求,只能采用ADTS裸流录制,技术比较复杂,这里就出现了重大BUG,录制流程走不通了,录制的音频无法播放。我使用Cluade4完全无法解决。无奈使用了Codex,尝试了几次也不行。最终选择了trae的GPT5-high,才算解决了这个BUG。
中断事件
由于音频是独占资源,被其他APP占用音频资源,或者闹铃,或者电话,被占用音频后,最开始设计的时候是自动关闭文件,但是想起来如果能自动恢复就非常好了,于是做了中断事件这个需求,要求用户能够知道那里断掉了,又重新恢复了,然后又出现问题了。
由于IOS的AAC到m4a转换过程中,不能有时间戳间断,否则无法转换,需要自己写重编码模式,而自己写的重编码模式,转换事件非常久,久到不能忍受,所以又求助ChatGPT,这里又拉扯了好久才找到BUG原因是什么,最终实现了中断是暂停重启录制而不是直接停止重新生成新的文件。说实在的,ChatGPT5真聪明!
多语言
这个是AI实现的,也是最后一步了,这个比较简单。
测试
整个开发的过程中,大概测试了100到200多次,每次更新就测试,然后提BUG,修改需求,直到满意为止。也测试过直接录制8个小时到音频,当然是睡觉前录制的,😊。
上架
IOS的上架操作非常繁琐,后续单独开一篇文章讲一下IOS的APP Store 个人上架流程。不过一次性审核通过,这个还是在ChatGPT的一步一步的指导之下才完成的!十分感谢ChatGPT!
定价
定价一开始是4.99美元,ChatGPT说定价太贵,是专业级的定价了,建议免费和订阅制,我说开始算了吧,估计到时候就没几个人使用,改成2.99美元了。
宣发
没有什么宣发,就后台生成了20个兑换码,reddit上放10个,小红书上放5个,小群放5个,后续再扩大范围吧。目前小红书效果比较好,reddit上只浏览没人回应啊, 也可能时间不对,再观察观察。
总结
- 这款APP虽然功能不丰富,估计销量不会很多,但是意义重大,也标志着许多像我一样的不会写代码的用户,可以利用AI做一些小工具了!
- AI非常强了,以后会更强!
- 目前本APP已上架非欧洲区,非中国大陆区,其余地区的IOS Store均已上架,定价2.99美元,感兴趣的麻烦去购买一下!。
- 第一款的IOS工具还在艰难的修改BUG中,因为涉及到视频录制,更复杂了,BUG更多,祈祷能够达到我的要求吧。
- 其实,我还做了第3款IOS工具,是款学习英语的,打算用来给自己学习英语,自己英语太差了,也暂时搁置中~,不过框架是已经有了,但是这款APP有着自己的问题,不太可能快速完成,还是先期待能够完成第一款的APP吧!