一、DeepSeek R2的核心技术概念
DeepSeek R2是杭州深度求索公司推出的新一代大语言模型,其核心技术突破体现在以下方面:
- 架构创新
- 采用Hybrid MoE 3.0混合专家架构,动态激活参数达1.2万亿,但实际计算消耗仅780亿参数,显著降低算力需求。通过自研FP8混合精度框架和DualPipe调度策略,训练能耗降低30%以上。
- 引入MLA(多头潜在注意力)架构,减少推理阶段的KV缓存,提升长文本处理效率,支持超长上下文建模。
- 成本与性能突破
- 经阿里云实测,单位token成本较GPT-4 Turbo降低97.3%,实现“高性能+低成本”的颠覆性优势,被称“AI界拼多多”。
- 在编程任务中,代码生成准确度提升20%,支持复杂代码结构解析与自动化生成,成为开发者高效工具。
- 多模态与场景应用
- 强化多语言推理能力,支持全球化应用场景,并优化多模态交互(如文本生成图像)。
- 在医疗、金融、教育等垂直领域表现突出,例如医疗知识图谱构建和慢病管理决策支持。
二、A股与港股相关企业名单
(一)A股合作企业
以下为与DeepSeek R2存在股权关联、技术合作或业务协同的A股公司:
类别 | 企业及合作内容 | 引用来源 |
---|---|---|
股权关联方 | - 浙文互联(600986) :通过产业基金持有深度求索6.67%股权 - 浙江东方(600120) :天使轮投资方(但后续公告澄清未直接参股) |
|
算力基础设施 | - 中科曙光(603019) :提供AI服务器与液冷系统支持 - 浪潮信息(000977) :合作开发混合架构服务器 - 景嘉微(300474) :国产GPU适配 |
|
技术合作与落地 | - 科大讯飞(002230) :集成R2模型于教育大模型 - 三六零(601360) :安全大模型接入R2 - 拓维信息(002261) :政务云与混合架构合作 |
|
行业应用 | - 美格智能(002881) :端侧AI应用开发 - 安恒信息(688023) :安全垂域大模型集成 - 卫宁健康(300253) :医疗AI辅助诊断 |
注:部分企业(如杭钢股份、华金资本)曾公告澄清合作细节,需注意风险。
(二)港股相关企业
港股中与DeepSeek R2有技术合作或生态关联的企业包括:
- 腾讯控股(00700) :通过腾讯云提供算力支持
- 金蝶国际(00268.HK) :低代码平台集成R2能力
- 商汤科技(00020.HK) :AI框架合作与多模态技术适配
三、产业链上下游企业图谱
DeepSeek R2的产业链覆盖算力、数据、模型开发、应用落地全链条:
环节 | 代表企业及角色 |
---|---|
上游(技术支撑) | - 芯片/GPU:寒武纪(688256)、海光信息(688041) - 服务器:紫光股份(000938)、中际旭创(300308) - 数据服务:海天瑞声(688787) |
中游(模型开发) | - 大模型研发:拓尔思(300229)、昆仑万维(300418) - 算法优化:云从科技(688327) |
下游(场景应用) | - 金融科技:恒生电子(600570)、同花顺(300033) - 智能硬件:歌尔股份(002241)、立讯精密(002475) - 医疗AI:万达信息(300168) |
四、风险提示
- 技术依赖风险:部分企业(如航锦科技)的合作仅限生态适配,非核心业务。
- 市场炒作风险:浙文互联等企业虽持股但占比较低,对业绩影响有限。
- 政策风险:美国出口管制可能影响国产芯片供应链。
以上信息整合自公开资料,具体投资需结合企业公告与市场动态综合分析。
发布此信息的目的在于传播更多信息,与本站立场无关。投资有风险,入市需谨慎。资料仅供参考不能作为投资依据,文章提及个股只做科普,不作推荐,不对任何人构成投资建议! 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 afuwuba@qq.com@qq.com 举报,一经查实,本站将立刻删除。,如若转载,请注明出处:https://www.bulexiu.com/n/29460.html