目前依托于云服务的 API,语音识别的识别率已经很高了。但是我们在使用 LazyTyper 时,还是会产生很多口语化的空格、语气词和重复的词语。 建议增加一个功能(可选开启):支持调用某类大模型的 API(当然可以推荐使用一些很小的模型,这不是一个很难的任务),将文本进一步加工,处理一下口语化的部分。 当然代价是端到端响应时间可能增长,这是用户需要权衡的地方。