Cartesia

Cartesia.ai是一家在人工智能领域有着显著进展和创新的公司。该公司近期发布了一款名为Sonic的极速语音生成模型和API，这标志着他们在构建实时多模态智能时代的重要一步。以下是对Cartesia.ai及其最新产品Sonic的详细介绍：

公司背景：
- Cartesia由一群在人工智能领域有深厚背景和丰富经验的专家组成，他们致力于通过创新技术推动智能时代的发展。
- 公司的创始人在斯坦福大学攻读博士学位期间开创了状态空间模型，为Sonic的研发奠定了基础。
产品介绍：
- Sonic语音生成模型：Sonic是一个极速的生成语音模型和API，拥有令人惊叹的低延迟（仅为135毫秒模型延迟）和栩栩如生的声音效果。它采用了全新的状态空间模型架构，有效地建模高分辨率数据，如音频和视频。
- 技术特点：Sonic在语音方面经过参数匹配和优化，在与广泛使用的Transformer相同的数据集上训练，显著提高了音频质量。这包括降低20%的困惑度、降低2倍的单词错误率以及提高1分的NISQA质量。此外，Sonic具有更低的延迟、更快的推理速度以及更高的吞吐量，为用户带来更出色的体验。
- 服务提供：Cartesia还提供了Web Playground和低延迟API，用户可以立即开始体验Sonic的强大功能。
愿景和目标：
- Cartesia的愿景是通过创新的人工智能技术，使智能更快、更便宜、更易获取。他们期待与社区一起探讨替代架构，并分享更多信息，以推动整个行业的发展。