Files
social-app/docs/todo/2026-03-17-asr.md
T

6 lines
672 B
Markdown
Raw Normal View History

- 当前项目有语音识别功能,但是语音识别的cost成本计算没有实现。目前我们用的模型是fun-asr-realtime-2026-02-28,价格是0.00033元/每秒。我希望把它做到backend/src/core/config/static/database/llm_catalog.yaml,加一个asr字段,引入model_code代替原agent router里的硬编码,通过加载配置获取模型信息和报价,然后根据后端路由接收到的音频长度然后来估算价格,或者看看dashscope的sdk是否会返回消耗token金额,将这个token金额看看如何审计
- 路由细分,方便agent url的导航跳转
- agent模式重构
- 日历导出和导入
- 手机号注册、登录