2025 年 1 月 20 日,DeepSeek(深度求索)正式发布了 DeepSeek-R1 模型,并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中,DeepSeek-R1 也是该平台上获赞最多的模型。 如今,刚过一年时间,DeepSeek 的新模型又在 GitHub 悄然现身。
今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。 相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。 一共两个模型,分别是 V3.1 和 V3.1 base。两个模型结构完全一致,V3.1 的 Base 模型在 V3 的基础上 ...
智东西2月6日报道,国产AI大模型DeepSeek的产业影响力还在蔓延。短短六天内,10家国产AI芯片企业(华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯)相继宣布适配或上架DeepSeek模型服务。 ▲截至2月6日,官宣支持DeepSeek模型的国产AI芯片企业(按时间顺序排列,智东西制表) 其中海光信息是科创板CPU+GPU上市公司,云天励飞是科创 ...
但每个人,也深有期待 V3.2 的性能已经追平 GPT-5 和 Gemini 3.0 Pro,而且开源 V3.2 和顶级闭源模型的 benchmark 对比,来自 DeepSeek V3.2 技术报告 接下来,让我们一起完整看看 DeepSeek 从 V3 到 V3.2 的演进过程中,看看每个版本改了什么,为什么改,以及怎么实现的 内容 ...
首个经过同行评审后发表的主流LLM。 开源人工智能(AI)的价值正获得更广泛的认可。 刚刚,DeepSeek-R1 论文以封面文章的形式登上了权威科学期刊 Nature,DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。 研究团队假设,人类定义的推理模式可能会限制模型的 ...
格隆汇2月7日|据大河财立方,今日从商周(河南)算力技术有限公司了解到,DeepSeek-R1、V3、Coder等系列模型已陆续上线郑庆哈算力调度服务平台。2025年1月20日,DeepSeek正式发布DeepSeek-R1模型,与OpenAI开发的ChatGPT相比,DeepSeek-R1作为国内自主研发的人工智能应用,不 ...
使用微信扫码将网页分享到微信 「服务器繁忙,请稍后再试。」 一年前,我也是被这句话硬控的用户之一。 DeepSeek 带着 R1 在一年前的今天(2025.1.20)横空出世,一出场就吸引了全球的目光。 那时候为了能顺畅用上 DeepSeek,我翻遍了自部署教程,也下载过不少 ...
6月3日最新消息,有外媒报道称,DeepSeek在首轮融资中预计筹资约500亿元,估值最高可达4000亿元。在此轮融资中,腾讯和宁德时代将成为DeepSeek最大的外部投资者。
DeepSeek-Coder-V2是由DeepSeek AI开发的开源代码生成模型,采用236B参数的MoE架构,支持338种编程语言和128K上下文长度。在代码生成、编辑和修复任务中表现卓越,性能媲美GPT-4 Turbo,位居全球开源模型前列。该模型通过持续更新保持竞争力,适用于复杂编程场景 ...
6月 16日,有媒体报道,DeepSeek(深度求索)已完成成立以来的首轮外部融资,募资总额约合人民币 500 亿元(74 亿美元),投后估值突破 500 亿美元(约合人民币 3380 亿元),大概率创下中国 AI 行业有史以来最大规模的单轮融资纪录。
作者:刘晓洁 郑栩彤 责编:李娜 前述内容由第一财经“星翼大模型”智能生成,相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别,第一财经不承担由此产生的任何责任。 如您有疑问或需要更多信息,可以联系我们 yonghu@yicai.com “没有 ...
DeepSeek首次融资的“金主”名单,逐渐浮出水面。 6月3日,媒体报道称,DeepSeek计划募集约500亿元人民币,投后估值达3500亿至4000亿元。相比上月底传闻的700亿元,最新传出的融资规模略有收缩。