在企业数字化转型的浪潮中,会议效率一直是痛点。传统的会议记录依赖人工,不仅效率低下,且信息留存率不足 30%。极客跳动联合推出的 AI 语音解决方案,旨在通过软硬一体化的设计,彻底解决这一难题。

项目背景
硬件拆解:极客的执着
为了实现极致的收音效果,我们定制了 6+1 环形麦克风阵列。但这还不够,我们在端侧植入了专用 DSP 芯片,在音频信号上传云端前,先在本地进行毫秒级的波束成形与声源定位。
面临的挑战
端云协同架构
传统的纯云端识别存在延迟。我们采用了“端侧预处理 + 云端大模型分析”的混合架构。端侧负责 VAD(语音活动检测)与降噪,云端千亿参数 Transformer 模型负责复杂的语义理解与纪要生成。
解决方案
自动化工作流
会议结束后,系统不仅生成逐字稿,还会自动提取“待办事项(Todo)”并推送到飞书/钉钉。这是 AI Agent 在办公场景的典型落地。
"技术本身不是目的,业务的指数级增长才是。"
