+Encoder/Decoder - 搜索 News

大模型才火？其实AI在医院看片早就卷出天际了

医学影像已成为现代医疗体系不可或缺的关键支柱，为疾病诊断、治疗方案制定与疾病管理提供关键依据。然而，计算机断层扫描 (CT)与磁共振成像 ...

3 天

HuggingFace CEO力荐，Bengio团队也押注：这个1500美元训出的HRM模型，凭 ...

好家伙，这次不是模型圈自嗨。一个训练成本约1500美元、参数量约1B、从零开始预训练的小模型，把HRM推到了下一代推理架构讨论的中心。 HuggingFace联合创始人兼CEO Clem Delangue亲自转发推荐。图灵奖得主Yoshua Bengio作为共同作者参与的新论文，也走向了同一条latent recursive reasoning路线。更反常的是，它不是蒸馏，不是微调，也不是在 ...

8 天

英伟达重新定义文生图最后一步：潜在表征直达4K，高精细节一步生成！

2K 图像 210ms 解码，4K 细节直接生成，传统「解码 + 超分」流水线可能要被重写了。文生图模型现已内卷至 4K、超写实、电影级光影水准，但一张 AI 图像要想像 GPT-Image2 ...

什么值得买社区频道 on MSN

硬盘越涨越贵，这个工具增加 NAS 30% 空间!极空间部署 Unmanic

有人整理了一张近几年的硬盘涨价表，其涨幅程度已堪比黄金。作为一个屯屯党，如果你跟我一样，看见好剧就忍不住下载，看到 4K、蓝光资源就走不动道，还有那 ...

雷锋网

CVPR 2026 Oral｜Google × TUM：LILA 想让每个像素都有自己的时空特征

导语：LILA 盯的是一个很基础、但常常被绕开的点：视觉 foundation model 很强，但很多输出仍然是 patch-level feature。 LILA 盯的是一个很基础、但常常被绕开的点：视觉 foundation model 很强，但很多输出仍然是 patch-level feature。做分类、检索，patch feature 很够用。

腾讯网

F1暴涨20分，推理速度恒定！新架构VGent：多目标定位又快又准

【新智元导读】多目标（Multi-target）以及视觉参照（Visual Reference）为视觉定位（Visual Grounding）任务的推理速度和性能同时带来了全新的挑战。为了解决这一难题，来自UIC和Adobe的研究团队提出了VGent模型。这是一种兼顾速度与性能的模块化设计，旨在将模型的 ...

GitHub

km1994/NLP-Interview-Notes

介绍：本项目是作者们根据个人面试和经验总结出的自然语言处理(NLP)面试准备的学习笔记与资料，该资料目前包含自然语言处理各领域的面试题积累。 3.1.1 隐马尔科夫算法是什么？ 3.1.2 隐马尔科夫算法中两个序列是什么？ 3.1.3 隐马尔科夫算法中三个矩阵 ...

搜狐

大模型架构演进：从Encoder到Decoder，解码器为何成为AI生成主流？

Transformer架构自诞生以来，便以其强大的灵活性和模块化设计，深刻地影响了人工智能领域的发展。从最初的BERT到如今的GPT-4，不同的结构变体在各自擅长的领域大放异彩。本文将深入探讨Transformer的四大主流结构，并重点分析Decoder-only结构在大语言模型中的崛起 ...

51CTO

ICML'25 | 兼容不同数据源周期性差异的时间序列基础模型

今天给大家介绍一篇ICML 2025的时间序列预测工作，提出了一个轻量级、兼容不同类型数据的周期性差异的时间序列基础模型，在Zero-shot learning、Full-shot learning等场景中都取得了显著效果提升。时间序列基础模型希望构建类似LLM的时序领域通用模型，在大量多样性 ...

51CTO

鸿蒙开发者社区

在上一篇文章中介绍了大模型的嵌入和向量，这一篇来介绍一下大模型的经典架构之Transformer架构的编码器和解码器。像很多人一样，一直在奇怪Transformer架构经过多层编码和解码之后就能处理输入数据并生成新的数据；所以，今天我们就来深入了解一下Transformer ...

IT之家

媒体播放器通用框架 FFmpeg 6.1 发布，新增 Playdate 解码分离器等

IT之家11 月 13 日消息，流行的开源多媒体框架 FFmpeg 发布了代号为 Heaviside 的 6.1 版本。 IT之家备注：FFmpeg 是一个开放源代码的自由软件，可以执行音频和视频多种格式的录影、转换、串流功能，包含了 libavcodec—— 这是一个用于多个项目中音频和视频的解码器库 ...

搜狐

微软马树铭：零样本迁移？全新多语言预训练模型DeltaLM！

导读：目前，多语言神经机器翻译受到越来越多的研究人员的关注，多语言预训练模型对神经机器翻译可以起到非常重要的作用。预训练模型自身的跨语言迁移能力，可帮助机器翻译减少标注和训练成本，提高机器翻译的跨语言迁移能力。我们提出了一个新的多 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果