AI圈开年首炸：139位中国清北名校天才创立一家震撼硅谷的企业

1月12日消息，据媒体报道，DeepSeek作为开年AI领域的重大突破，以其“国产之光”的新形象震撼了海内外科技界。这家AI创业企业以其独特的团队构成和卓越的技术成就，成为了业界关注的焦点。

从公开资料来看，DeepSeek的团队规模虽小，但实力不容小觑。其创始人梁文锋领导的团队仅有139名工程师和研究人员，相比之下，OpenAI拥有1200名研究人员，Anthropic也有500多名。

然而，DeepSeek凭借一系列吸睛的标签，如“未寻求外部融资”、“创始人囤卡富翁”、“团队成员均为清北等名校毕业生”等，成功在AI创业圈中崭露头角。

AI圈开年首炸：139位中国清北名校天才创立一家震撼硅谷的企业-第1张-信息-51硕博论文

2024年12月，DeepSeek发布了最新的V3开源模型，该模型在评测中表现出色，不仅超越了阿里自研的Qwen2.5-72B和Meta自研的Llama 3.1-405B等顶级开源模型，甚至能与GPT-4o、Claude 3.5-Sonnet等顶级闭源模型相媲美。

值得注意的是，DeepSeek V3大模型发布后便完全开源，且其训练成本远低于同类模型。据SemiAnalysis数据显示，OpenAI GPT-4的训练成本高达6300万美元，而DeepSeek-V3的成本仅为其十分之一不到。

此外，DeepSeek V3模型的训练是在2000块英伟达H800 GPU上完成的，这一数量远低于硅谷大厂普遍使用的几十万块更高性能的GPU。这一成就打破了算力芯片对国产大模型的限制瓶颈，为创业团队提供了新的解法：即便在算力有限的情况下，使用高质量数据和更好的算法，同样能训练出高性能大模型。

OpenAI创始团队成员Andrej Karpathy发帖赞叹：DeepSeek-V3性能高过Llama3最强模型，且耗费资源仅十分之一，“未来或许不需要超大规模的GPU集群了”。

Meta科学家田渊栋惊叹道：“FP8预训练、MoE、预算非常有限的强大性能、从CoT中提取以进行引导……哇！这是伟大的工作！”

AI圈开年首炸：139位中国清北名校天才创立一家震撼硅谷的企业-第2张-信息-51硕博论文

DeepSeek的创始人梁文锋对硅谷的惊叹并不感到意外。他认为，这是因为DeepSeek作为一个中国公司，正在以创新贡献者的身份加入到全球AI技术的竞争中。他指出，中国需要逐步成为技术的贡献者，而不是一直依赖西方的创新成果。

梁文锋还强调了中国AI发展需要建立自己的技术生态，就像西方主导的技术社区一代代创造出了摩尔定律和Scaling Law一样。他认为，很多国产芯片发展不起来，正是因为缺乏配套的技术社区和前沿技术的参与。

公开资料显示，DeepSeek的母公司幻方量化是一家量化基金起家的企业，与DeepSeek的用人风格相似，均注重本土人才。DeepSeek在AI产品正式亮相前，曾长时间内部孵化该产品，并招聘文科人才提供相关知识来源。这一独特的历程使得DeepSeek在AI领域独树一帜，成为中国AI技术创新的佼佼者。

免责声明：本文章由会员“极目新闻”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

AI圈开年首炸：139位中国清北名校天才 创立一家震撼硅谷的企业

相关推荐

AI圈开年首炸：139位中国清北名校天才创立一家震撼硅谷的企业