Deepseek R1 Coder - 搜索 News

R1一周年，DeepSeek Model 1悄然现身

2025 年 1 月 20 日，DeepSeek（深度求索）正式发布了 DeepSeek-R1 模型，并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中，DeepSeek-R1 也是该平台上获赞最多的模型。如今，刚过一年时间，DeepSeek 的新模型又在 GitHub 悄然现身。

腾讯网

手把手：1分钟把 Claude Code 迁到 DeepSeek V3.1，开箱即干

今天下午，DeepSeek 官方正式发布 DeepSeek-V3.1。相比于前天只在用户群里通知，今天新增了模型升级点、榜单成绩、model card，huggingface 上现在也可以下载模型文件了。一共两个模型，分别是 V3.1 和 V3.1 base。两个模型结构完全一致，V3.1 的 Base 模型在 V3 的基础上 ...

6 个月

智东西2月6日报道，国产AI大模型DeepSeek的产业影响力还在蔓延。短短六天内，10家国产AI芯片企业（华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯）相继宣布适配或上架DeepSeek模型服务。 ▲截至2月6日，官宣支持DeepSeek模型的国产AI芯片企业（按时间顺序排列，智东西制表）其中海光信息是科创板CPU+GPU上市公司，云天励飞是科创 ...

腾讯网

V3→R1→V3.2｜一文看懂DeepSeek技术演进

但每个人，也深有期待 V3.2 的性能已经追平 GPT-5 和 Gemini 3.0 Pro，而且开源 V3.2 和顶级闭源模型的 benchmark 对比，来自 DeepSeek V3.2 技术报告接下来，让我们一起完整看看 DeepSeek 从 V3 到 V3.2 的演进过程中，看看每个版本改了什么，为什么改，以及怎么实现的内容 ...

36氪

DeepSeek-R1登上Nature封面：朝着AI透明化迈出的可喜一步

首个经过同行评审后发表的主流LLM。开源人工智能（AI）的价值正获得更广泛的认可。刚刚，DeepSeek-R1 论文以封面文章的形式登上了权威科学期刊 Nature，DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。研究团队假设，人类定义的推理模式可能会限制模型的 ...

来自MSN

商周算力：DeepSeek-R1、V3、Coder等系列模型已上线郑庆哈算力调度服务 ...

格隆汇2月7日｜据大河财立方，今日从商周(河南)算力技术有限公司了解到，DeepSeek-R1、V3、Coder等系列模型已陆续上线郑庆哈算力调度服务平台。2025年1月20日，DeepSeek正式发布DeepSeek-R1模型，与OpenAI开发的ChatGPT相比，DeepSeek-R1作为国内自主研发的人工智能应用，不 ...

爱范儿

DeepSeek R1发布一年了，不卷功能、不融资、不着急，凭什么「硬控」硅谷

使用微信扫码将网页分享到微信「服务器繁忙，请稍后再试。」一年前，我也是被这句话硬控的用户之一。 DeepSeek 带着 R1 在一年前的今天（2025.1.20）横空出世，一出场就吸引了全球的目光。那时候为了能顺畅用上 DeepSeek，我翻遍了自部署教程，也下载过不少 ...

14 天

DeepSeek，突传重磅消息！

6月3日最新消息，有外媒报道称，DeepSeek在首轮融资中预计筹资约500亿元，估值最高可达4000亿元。在此轮融资中，腾讯和宁德时代将成为DeepSeek最大的外部投资者。

太平洋电脑网

DeepSeek-Coder-V2

DeepSeek-Coder-V2是由DeepSeek AI开发的开源代码生成模型，采用236B参数的MoE架构，支持338种编程语言和128K上下文长度。在代码生成、编辑和修复任务中表现卓越，性能媲美GPT-4 Turbo，位居全球开源模型前列。该模型通过持续更新保持竞争力，适用于复杂编程场景 ...

1 天