语音对话 AI

连接配置

API Key

交互方式

按住麦克风说话，松开发送，适合嘈杂环境

技术链路

Realtime 端到端: 一个模型处理全部，延迟最低
ASR + Qwen-Omni: 语音识别 + Omni 模型直出音频
ASR + LLM + TTS: 支持自定义/克隆音色

自定义音色 ID

记忆方案

Digest: 最近对话高保真 + 历史对话摘要压缩
mem0: 基于向量检索的记忆（需配置 mem0 API）

提示：API Key 可从阿里云 DashScope 控制台获取。

用户ID (记忆标识):