18631817090
行业动态
当前位置: 首页 > 行业动态

DeepSeek-R1 的模型参数规模和上下文长度是多少?

日期: 2025-03-12 阅读: 142
DeepSeek-R1 的模型参数规模和上下文长度如下:
1. 模型参数规模:DeepSeek-R1 的满血版模型参数规模为 6710亿参数。这是一个混合专家模型(MoE),在每次推理时仅激活 370亿参数。

2. 上下文长度:DeepSeek-R1 的输入上下文长度为 128K tokens。这一长度是通过 YaRN 技术从基础的 4K 上下文长度扩展而来。

如果需要处理更长的文本序列,DeepSeek-R1-Zero 的上下文窗口可以扩展到 8192 tokens。

Warning: mysqli_num_rows() expects parameter 1 to be mysqli_result, bool given in C:\www\phpSite\qinkuainiu.com\system\library.php on line 10

Warning: mysqli_fetch_array() expects parameter 1 to be mysqli_result, bool given in C:\www\phpSite\qinkuainiu.com\system\library.php on line 7
  • 电子邮箱

    cnbbser@163.com

  • 客服热线

    18631817090

  • WhatsApp

    18631817090

  • 微信

你好,我们能为你做什么?
版权所有2008-2021保留所有权利