首页模型博客&论文加入我们

EN

中文

首页模型博客&论文加入我们

Speech

Seed-语音团队的使命是利用多模态语音技术丰富交互和创作方式。团队专注于语音和音频、音乐、自然语言理解和多模态深度学习等领域的前沿研究和产品创新

研究进展

Seed LiveInterpret

Seed LiveInterpret

Seed LiveInterpret 实时同声传译模型，可提供高质量、低延迟的语音到语音传译，并支持实时声音复刻。与传统的级联式（语音-文本-语音）系统相比，Seed LiveInterpret 采用的端到端架构在传译质量和延迟方面均有显著改善。

Seed Realtime Voice Model

Seed Realtime Voice Model

Seed Realtime Voice Model 实时语音大模型，可实现真人级别的端到端语音对话交互。相比传统级联模式，在语音表现力、控制力、情绪承接方面表现惊艳，并具备低时延、对话中可随时打断等特性。

Seed-Music

Seed-Music 是一个具有灵活控制能力的音乐生成模型家族，提供了可控音乐生成、谱转曲、词曲编辑、零样本人声克隆四大核心功能，融合了语言模型和扩散模型优势，融入作曲工作流。

精选论文

2025.07.24

Seed LiveInterpret 2.0: End-to-end Simultaneous Speech-to-speech Translation with Your Voice

Speech&Audio

2025.02.25

You Only Sample Once: Taming One-Step Text-to-Image Synthesis by Self-Cooperative Diffusion GANs

Computer Vision

2024.09.13

Seed-Music: A Unified Framework for High Quality and Controlled Music Generation

Speech&Audio

热招岗位

语音机器学习平台开发工程师-Seed

北京/上海/杭州/深圳

大模型数据工程师-Seed

北京/上海/杭州/深圳

高性能计算研发工程师-Seed

北京/上海/杭州/深圳

音视频多模态算法工程师-Seed

北京/上海/杭州/深圳

音频多模态算法研究实习生-Top Seed Intern

北京/上海/杭州/深圳

模型成果

Seed2.0 Seedance 2.0 Seedream 5.0 Lite Seed LiveInterpret 2.0 Seed Realtime Voice Seed Music

研究团队

LLM Infrastructures Vision Speech Multimodal Interaction & World Model AI for Science Robotics Responsible AI

了解更多

研究成果团队动态 Seed Edge Top Seed 加入我们

模型成果

Seedream 5.0 Lite

Seed LiveInterpret 2.0

Seed Realtime Voice

研究团队

Infrastructures

Multimodal Interaction & World Model

了解更多

追求智能上限，创造社会价值

欢迎加入字节跳动 Seed

Copyright © 2026 Bytedance Seed

联系我们 : seed.feedback@bytedance.com

欢迎加入字节跳动 Seed

Copyright © 2026 Bytedance Seed