智能语音对话助手 · 技术链路介绍
按住麦克风说话,松开发送,适合嘈杂环境
Realtime 端到端: 一个模型处理全部,延迟最低
ASR + Qwen-Omni: 语音识别 + Omni 模型直出音频
ASR + LLM + TTS: 支持自定义/克隆音色
Digest: 最近对话高保真 + 历史对话摘要压缩
mem0: 基于向量检索的记忆(需配置 mem0 API)
提示:API Key 可从阿里云 DashScope 控制台获取。
按住麦克风说话,松开发送
AI 请求拍照