[Feature Request] 支持进一步使用模型处理口语化部分，使文本更加连贯。

目前依托于云服务的 API，语音识别的识别率已经很高了。但是我们在使用 LazyTyper 时，还是会产生很多口语化的空格、语气词和重复的词语。

建议增加一个功能（可选开启）：支持调用某类大模型的 API（当然可以推荐使用一些很小的模型，这不是一个很难的任务），将文本进一步加工，处理一下口语化的部分。

当然代价是端到端响应时间可能增长，这是用户需要权衡的地方。