北京时间1月28日早上,近期备受关注的DeepSeek(深度求索)传出两件大事:遭受大规模恶意攻击以及其产品在图像生成基准测试中超越了OpenAI的DALL-E 3模型。这家中国公司再次引起全球瞩目。
DeepSeek是一家由量化幻方运营的创新性大模型公司。幻方量化自2016年起推出首个AI模型,并于2023年成立了DeepSeek。2024年12月,DeepSeek发布了最新的AI模型DeepSeek-V3,并同步开源,训练成本仅为557.6万美元,整个训练只需要280万个GPU小时。这一低成本高性能的特性使其迅速吸引了硅谷的关注,脸书母公司meta甚至为此成立了四个专门研究小组来研究DeepSeek的工作原理,并基于此改进自己的Llama模型。
DeepSeek的产品不仅在技术上表现出色,在市场上也获得了巨大成功。1月27日和28日,DeepSeek在中国区和美国区苹果App Store免费榜均位列首位,超越了包括ChatGPT在内的多个知名AI产品。然而,由于用户访问量激增,DeepSeek曾出现两次宕机现象。对此,公司回应称问题已在数分钟内得到解决。
面对大规模恶意攻击,DeepSeek采取了限制非+86手机号注册的方式以确保服务持续。尽管如此,一些用户仍然遇到了登录失败的问题。记者尝试通过官网和微信扫码登录,但未能成功。