通过电子邮件获得新工作
- ...稳定性提升的工作; 支持百亿~万亿规模参数的 稠密(dense)/稀疏(moe)模型的预训练(pretrain/CPT)和后训练(SFT/RL)能力建设和优化工作 通过推理和训练加 速,训推一体复用等技术,在前沿的异构设备上实现极致的强化学习 任职要求 有扎实的工程法基础,有中大规模集群的文本(语音/图像,视频大模型高性能训练代码实现(包括不限于Owen、LLama、BUP2.LaVA、MInIGPT.VISUAIGL.OWeDHV OwenAudioCosyVoice),以及实际训练经验 有大模型分布式训练经验,有大规模分布...