DeepSeek透露下一代国产芯片即将发布

发布时间:2025-08-24 来源:互联网

8月21日消息,深度求索官方今日正式对外发布DeepSeek-V3.1,官方提到DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。

在DeepSeek官方公众号文章页面,DeepSeek进一步解释称,UE8M0FP8是针对即将发布的下一代国产芯片设计。

注:FP英文全称为FloatingPoint,是IEEE定义的标准浮点数类型。UE8M0FP8在AI模型领域代表一种模型精度。

DeepSeekV3.1的Base模型在V3的基础上重新做了外扩训练,一共增加训练了840Btokens。Base模型与后训练模型均已在Huggingface与魔搭开源。附开源地址:

Base模型:

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

魔搭:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

后训练模型:

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1

魔搭:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

本周热门教程

1
德国人工智能研究与应用挑战

德国人工智能研究与应用挑战

2025/06/04

2
算力支撑让人工智能在中国行稳致远

算力支撑让人工智能在中国行稳致远

2025/01/02

3
OpenAI停止对中国大陆提供API服务,国产大模型应抓住机遇

OpenAI停止对中国大陆提供API服务,国产大模型应抓住机遇

2025/06/28

4
华为发声、运营商力推!5G-A与人工智能融合“移动AI时代”有望开启

华为发声、运营商力推!5G-A与人工智能融合“移动AI时代”有望开启

2025/06/29

5
人工智能、绿色转型、前沿创新——夏季达沃斯论坛上的中国经济“热词”

人工智能、绿色转型、前沿创新——夏季达沃斯论坛上的中国经济“热词”

2025/06/30

6
人工智能不仅带来技术水平提高,更可提升创造力

人工智能不仅带来技术水平提高,更可提升创造力

2025/06/30

7
给“后浪”做饭的AI创业者:思考如何让它穿越周期

给“后浪”做饭的AI创业者:思考如何让它穿越周期

2025/06/30

8
昆仑万维:将继续践行“AllinAGI与AIGC”纵深推进人工智能在游戏等多领域应用

昆仑万维:将继续践行“AllinAGI与AIGC”纵深推进人工智能在游戏等多领域应用

2025/07/21

9
Anthropic最新研究:在被对齐前,模型已经会说谎了

Anthropic最新研究:在被对齐前,模型已经会说谎了

2025/07/22

10
《爱、死亡与机器人》司马华鹏用AI重新定义生命的边界

《爱、死亡与机器人》司马华鹏用AI重新定义生命的边界

2025/01/31