热门

英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型

热点资讯2年前发布时间煮雨

4,282 00

开源AI模型：英伟达开源了一款名为Nemotron-Mini-4B-Instruct的AI模型，这是该公司在AI领域的又一创新。
专为特定任务设计：该模型专为角色扮演、检索增强生成（RAG）和函数调用等任务设计，是一个小语言模型（SLM），通过蒸馏和优化更大的Nemotron-4 15B模型获得。
技术优化：英伟达使用了剪枝、量化和蒸馏等AI技术，使模型更小巧高效，适合设备端部署。
性能保持：尽管模型体积缩小，但在角色扮演和功能调用等特定场景下的性能并未受影响，适合需要快速响应的应用。
技术规格：模型具有3072的Embedding Size，32个多头注意力，9216的MLP中间维度，能够处理大规模输入数据集。
架构特点：模型采用组查询注意力（GQA）和旋转位置嵌入（RoPE）技术，基于Transformer解码器架构，是自回归语言模型。
应用场景：Nemotron-Mini-4B-Instruct在角色扮演应用领域表现出色，可以嵌入到虚拟助手、视频游戏等交互式环境中。英伟达还提供了特定的提示格式以优化模型在单轮或多轮对话中的输出。
函数调用优化：模型针对函数调用进行了优化，适合需要与API或其他自动化流程交互的环境。

文章强调了英伟达在AI领域的创新和开源精神，以及Nemotron-Mini-4B-Instruct模型在特定应用场景中的潜力和优势。如果您对文章的详细内容或其他相关信息有任何疑问，请随时告诉我。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

阿里云ECS “99套餐” 双11特惠 36元/年

相关文章

智谱 AI 发布视频生成工具“清影”：30 秒快速生成，免费开放体验

智谱 AI 发布视频生成工具“清影”：30 秒快速生成，免费开放体验

热点资讯 # AI 文本生成视频 # bigmodel.cn # CogVideoX

2年前

010,4670

因 AI 生成的艺术作品注册申请被拒，当事艺术家向美国版权局提出上诉

因 AI 生成的艺术作品注册申请被拒，当事艺术家向美国版权局提出上诉

热点资讯 # 版权局

2年前

05,7630

消息称 OpenAI 公司 2024 年资金缺口达到 50 亿美元

消息称 OpenAI 公司 2024 年资金缺口达到 50 亿美元

热点资讯 # ChatGpt # Microsoft Azure # OpenAI

2年前

06,5580

百度副总裁薛苏：“文小言”月活超千万，今年 Q2 累计调用量达 20 亿次

百度副总裁薛苏：“文小言”月活超千万，今年 Q2 累计调用量达 20 亿次

热点资讯 # 文小言 # 文小言App

2年前

05,6850

暂无评论

none

暂无评论...