21世纪经济报道记者 闫启 北京报道
“DeepSeek这波起来得太快,不光是其他大模型企业,背后的投资人最近压力也很大。”北京一家VC投资经理陈雨桐向记者感叹。“本来大家都是在烧钱,突然现在出了一家公司用十分之一甚至几十分之一的钱,搞出来一个和你差不多甚至比你还好的东西,这谁还坐得住?”
据记者了解,在DeepSeek的影响下,国内不少投AI的VC们开始重新审视过去AI的投资策略。
AI大模型还能不能投?
ChatGPT当初用户过亿用了3个月已经足够惊人,谁也没想到DeepSeek达成这一成就,只用了7天。
另一家VC的合伙人周明远看来,“或许未来AI大模型会逐渐开始向应用侧调整导致公司价值会有所下降,但对于已经参与的VC仍然是有价值的。参与到了AI最前沿的企业中,对AI的认知一定是领先其他没有投资AI大模型的投资人的。对于投资人来说,认知价值是不可估量的,在未来的投资中会起到非常大的帮助。也许从单笔投资来看可能会有一些亏损,但是投资人不能只看单笔投资的盈亏,而是要去实现投资组合盈利的最大化。”
一家AI六小虎的早期投资人更是坦言,“我们2014年开始就没在看大模型机项目了”。
有业内人士向记者透露,去年下半年,红杉中国内部已经重新评估对AI大模型的投资。在国内头部的AI大模型六小虎中,红杉也仅参与了月之暗面和智谱AI两家的融资,其中月之暗面是参与了天使轮和A+轮,智谱AI是的B+轮和D轮。相比起红杉中国在互联网时代的投资风格,还是十分谨慎的。
“早在2023年我们团队已经对国内几家AI独角兽摸排过一遍,也包括DeepSeek,当时我们认为国产大模型本质上还是和ChatGPT的技术路线类似,但是中国在高端GPU禁售的情况下,很难做出性能上超越ChatGPT的大模型,因此就没有出手,如今来看,在Transformer架构下,这个判断依旧是成立的,如今国内市场的大模型企业,我们会更加关注新架构的大模型项目。”就职于某家美元基金的合伙人吴晓琳表示。据了解,今年1月,国内已经有一家名为RWKV元始智能的非Transformer架构大语言模型企业宣布完成天使轮融资。
对于未来AI大模型的格局,吴晓琳给出了她的判断:“回头看2023年初的ChatGPT和2024年初的kimi,也一度给行业带来非常的震动。但大模型的战争还会继续,我不认为现在就可以宣布DeepSeek会是国内大模型的最终胜利者。”
开源还是闭源?
相较于普通人,专业的VC对于DeepSeek的判断更加理性,“从技术上来说,DeepSeek对于行业没有本质上的变化,DeepSeek展现出来的长链路推理能力,其实去年9月OpenAI发布的GPT o1上就已经展现出来了”,陈雨桐表示。
1月20日,月之暗面发表Kimi K1.5多模态思考模型,不但和DeepSeek-R1的技术路线相似,还略早于DeepSeek-R1发布。2月18日,DeepSeek与月之暗面几乎同时发布了各自最新的论文,而主题再度“撞车”。
后面OpenAI论文里提及的两个发现了O1奥秘的中国公司就是DeepSeek和月之暗面,在长思考模式(long - CoT)下,Kimi k1.5甚至是全球唯一在 OpenAI 之外实现 O1 级别多模态推理性能的模型。
但是两者的效果却天差地别,一个改写世界AI格局引发全球热议,一个却反响平平,这或许就是开源的力量。
此前大模型领域,闭源派一直站在上风,大模型第一梯队的企业,谷歌、Anthropic等大都选择闭源。就连OpenAI这家曾经以开放和透明著名的企业,随着ChatGPT的爆红和大量资本的涌入,也逐渐改变了初衷,自GPT-4以来OpenAI就没有继续公开起训练数据、算力成本等诸多细节。在目睹DeepSeek火爆出圈以及行业迎来变革后,罕见地表态称OpenAI在开源AI软件方面“一直站在历史的错误一边”。
2024年世界人工智能大会上,李彦宏谈及开源与闭源大模型,曾表示开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。如今他也站出来承认,“从DeepSeek身上,我们学到了一件事,那就是开源最佳模型能大大促进人们使用或采纳这个模型。”
“开源并非不能商业化,AI大模型可以参照谷歌开源安卓系统的模式,不从系统本身赚钱,而是等生态发展起来之后从广告和Google Play等应用上赚钱。”吴晓琳表示,不过她也提醒:“千万不要认为开源了就一定能火,开源社区里的大模型能够成为DeepSeek的概率甚至不到1%。开源只是其爆火的一个必要但不充分条件,前提是先要有被市场认可的实力。DeepSeek接下来的关键,将是能否在开源路径中持续保持创新和领先。”
更大的投资机会在应用端?
或许,两年前还有人质疑做AI应用的壁垒问题,如今在DeepSeek的影响下,投资AI应用几乎成了VC圈的共识。
“DeepSeek的影响更多还是加速整体AI应用落地的速度,让更多的企业可以更低成本去部署自己的模型”,周明远接着补充说:“但是这个效应不容小觑,不但让AI大模型在中国的普及程度大幅上升,各行各业都开始接入AI,同时这帮助中国的AI创业者提升了极大的信心。之前大家都觉得中国的创业在商业模式上、营销上很强,但是在基础AI领域与世界第一梯队仍然有差距。”
可以看到,微软、亚马逊、英伟达等全球科技巨头迅速接入DeepSeek模型,国内涉及政务、能源、通信、医院等多个领域的部门,以及央企、互联网大厂也纷纷上线部署DeepSeek模型。
“这对于中国AI创业者们是一个巨大的福利,外资其实一直认为中国AI的发展速度是缓慢的,但DeepSeek的出现为中国的AI产业是一次正名,他们不得不重新审视中国的AI创业公司。未来中国的创业公司走向海外市场,不论是获客还是融资的难度都是会下降很多。最近中国科技股的大涨,也印证了这一观点。”吴晓琳也同样赞同DeepSeek对于国产AI企业的积极影响。
中国市场拥有全球最丰富的应用场景,这也是曾经创造出一个互联网时代辉煌的基础。在同一片市场中,VC们的目标就是投出AI时代里的腾讯、阿里。但不论是国外的谷歌、亚马逊,还是国内的腾讯、阿里,都不是互联网时代一开始就诞生出来了,投资人对于AI应用的投资应该更有耐心。
(文中陈雨桐、周明远、吴晓琳均为化名)
0 条