AI 软硬结合,智能语音

北美AI录音卡APP

某知名创业公司
客户项目周期 6-12 个月 5 min read

在企业数字化转型的浪潮中,会议效率一直是痛点。传统的会议记录依赖人工,不仅效率低下,且信息留存率不足 30%。极客跳动联合推出的 AI 语音解决方案,旨在通过软硬一体化的设计,彻底解决这一难题。

Cover

项目背景

硬件拆解:极客的执着

为了实现极致的收音效果,我们定制了 6+1 环形麦克风阵列。但这还不够,我们在端侧植入了专用 DSP 芯片,在音频信号上传云端前,先在本地进行毫秒级的波束成形与声源定位。

面临的挑战

端云协同架构

传统的纯云端识别存在延迟。我们采用了“端侧预处理 + 云端大模型分析”的混合架构。端侧负责 VAD(语音活动检测)与降噪,云端千亿参数 Transformer 模型负责复杂的语义理解与纪要生成。

解决方案

自动化工作流

会议结束后,系统不仅生成逐字稿,还会自动提取“待办事项(Todo)”并推送到飞书/钉钉。这是 AI Agent 在办公场景的典型落地。

"技术本身不是目的,业务的指数级增长才是。"