近日,名为DeepSeek(深度求索)的中国AI初创公司在不到30天的时间里先后发布DeepSeek-V3和DeepSeek-R1两款大模型,火爆全网,持续引发热议。 1月28日,一直被看作是美国人工智能领域引领者的OpenAI公司的首席执行官萨姆·奥尔特曼(Sam Altman)终于在社交媒体平台X上发声,对DeepSeek-R1模型首次亮相表示欢迎,并表态将加快产品发布速度并“提供更好的模型”。
他在推文中写道:“DeepSeek的推理大模型R1是一款令人印象深刻的模型,尤其是考虑到其性价比。显然,我们将推出更好的模型。有新的竞争对手加入,着实令人振奋。”
DeepSeek-R1模型之所以火爆科技圈,关键在于其只需要使用比OpenAI-o1低90%至95%的API调用成本,就可以在数学、编程和推理等关键领域达到与OpenAI-o1相媲美的表现。尽管如此,奥尔特曼仍坚持强调,仍然需要更多算力才能完成使命。
“最重要的是,我们很高兴能继续执行我们的研究路线图,并相信更多的算力比以往任何时候都更重要,以成功完成我们的使命。”奥尔特曼补充道,“世界将会想要使用大量的人工智能,并且会对下一代模型的到来感到非常惊讶。”
当地时间1月27日,受DeepSeek发布新款大模型影响,美国股市开盘即大幅下跌,科技板块尤为惨重。纳指收跌超3%,英伟达股价暴跌17%,市值蒸发规模创美国股市史上最大,欧美芯片制造商以及为AI和数据中心供电的全产业链公司全军覆没。
市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位。此前,Visible Alpha汇编的数据显示,考虑到提高AI能力需要大量的计算能力,微软、Meta、Alphabet、亚马逊和甲骨文已为2025年的资本支出预留了3100亿美元,其中包括AI基础设施。而DeepSeek以OpenAI及其竞争对手Anthropic、谷歌和Meta的一小部分预算进行竞争,引发了人们对投入到训练系统的巨额资金的质疑。
据报道,英伟达在股价暴跌后发布声明,称DeepSeek的进步表明了其芯片在中国市场的有效性,未来将需要更多的英伟达芯片来满足对DeepSeek的服务需求。
DeepSeek也引起了美国总统特朗普的注意。当地时间1月27日,他在佛罗里达州迈阿密举行的共和党会议上表示,中国人工智能初创公司DeepSeek的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利。”同时,特朗普认为DeepSeek崛起也可能传递了一种积极信号。
值得一提的是,1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。
据悉,Janus-Pro是该公司去年发布的Janus的高级版本,可显著提高多模式理解和视觉生成。相比此前的Janus,Janus-Pro优化的训练策略、扩展的训练数据和扩展到更大的模型尺寸。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令遵循能力方面都取得了显著的进步,同时也增强了文本到图像生成的稳定性。