AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: 刚刚 ...
适用于常规 AI 模型和 MoE。 DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的 ...
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: ...
芯东西4月24日报道,刚刚,华为昇腾直播解读DeepSeek-V4技术,并披露昇腾950性能表现。截至发稿,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌和英伟达均已适配DeepSeek-V4。 昇腾950性能表现(图源:昇 ...
2025年1月,中国初创公司DeepSeek宣称,其研发的先进人工智能系统耗资仅为美国竞争对手的零头,这一消息震惊了业界。 Kelsey McClellan for The New York Times 去年,中国人工智能初创企业深度求索(DeepSeek)发布了旗下一款人工智能模型的详细资料,一举震惊全球科技行业。
DeepSeek在“省钱”和“省资源”上达到了变态的程度。 DeepSeek-V4总算来了。 4月24日,DeepSeek官方账号发布了一篇名为《DeepSeek-V4 预览版:迈入百万上下文普惠时代》的文章。文章中正式宣布,“全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。” 同时,还 ...
DeepSeek官网近日挂出一批新岗位招聘信息,工作地点覆盖杭州与北京,涉及Agent深度学习算法研究员、数据评测专家及基础设施工程师等职位。这一动作被业界视为其即将发布的新一代大模型DeepSeek V4的重要布局,该模型预计于4月面世,其战略方向正引发广泛关注。
还是没想到这么划算。 最近几天,一个叫 DeepSeek-TUI 的开源项目突然在 GitHub 彻底火了,仅仅在过去一天,Star 数量直接从 8.7k 又涨到了 16.3k。 DeepSeek-TUI 不是 DeepSeek 官方产品,而是个人开发者基于 DeepSeek V4 开发的终端原生编程智能体。但它涨星的速度很快 ...
近日,人工智能领域再度迎来重要更新,DeepSeek官方悄然发布了其最新版本的模型——DeepSeek-V3.1。这一消息迅速在网络上发酵,仅仅一个小时内,在某社交平台上的浏览热度便飙升至26万,彰显了业界与公众的高度关注。 据悉,DeepSeek-V3.1是一款集思考模式与非 ...
2026年4月24日,DeepSeek V4-Pro和DeepSeek V4-Flash正式发布并开源,模型上下文处理长度由原有的128K显著扩展至1M,首次增加了KV Cache滑窗和压缩算法,大幅减少Attention计算和访存开销,并通过模型架构创新更好地支持了Agent和Coding场景。昇腾一直同步支持DeepSeek系列模型 ...
蛇年春节前后,中国人工智能企业深度求索(DeepSeek)以其开源模型DeepSeek-R1在全球掀起一场“惊叹风暴”。 爆火的速度令人惊叹。1月20日,DeepSeek正式发布DeepSeek-R1。一周之内,DeepSeek便登顶中美两国苹果手机应用商店免费榜榜首,不久又在约140个国家的手机 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果