跳至内容
rayzark小屋
rejirshaoj

rejirshaoj

微调,强化学习,缩放

2025年4月15日 作者 rejirshaoj

大语言模型中的强化学习则有很大不同。大语言模型不是从有限的行动集中选择,而是从庞大的词汇表中选择标记,并且它们 … 阅读更多

分类 学习记录 标签 大模型 发表评论

零基础入门:DeepSeek微调教程来了!

2025年3月3日 作者 rejirshaoj

零基础入门:DeepSeek微调教程来了!

分类 学习记录 标签 转载 发表评论

TRANSFORMER EXPLAINER:如何用互动方式学会“爆火”的文本生成模型

2025年2月5日 作者 rejirshaoj

整个文本生成的 Transformer 模型可以分成三大块: 把文字转成数字向量(让机器听懂我们的语言)。 包 … 阅读更多

分类 学习记录、 未分类 标签 大模型 发表评论

Ubuntu操作指南

2024年12月11日2024年12月6日 作者 rejirshaoj

挂载数据云盘、创建训练环境 在webssh端输入lsblk 可以看到vdb是我们的数据云盘,没有分区,disk … 阅读更多

分类 学习记录 标签 云服务器、 云盘 发表评论

TongGu 大模型

2024年12月2日 作者 rejirshaoj

开发了TongGu,一个领先的垂直领域LLM,擅长管理广泛的CCU任务; 设计了一个从文言文文本自动生成指令数 … 阅读更多

分类 学习记录 标签 大模型 发表评论

WenMind

2024年12月1日 作者 rejirshaoj

WenMind 是一个综合性基准测试,专门用于评估中国古典文学和语言艺术 (CCLLA) 中的大型语言模型 ( … 阅读更多

分类 学习记录 标签 大模型 发表评论

Wiseflow

2024年11月27日 作者 rejirshaoj

首席情报官(Wiseflow) 🚀 首席情报官(Wiseflow)是一个敏捷的信息挖掘工具,可以从网站、微信公 … 阅读更多

分类 学习记录 发表评论

领域模型训练

2024年11月27日 作者 rejirshaoj

背景 简单来说,领域模型 / 专家模型 就是在某一个专业领域性能特别好的模型,可能包括法律、医学、教育、rol … 阅读更多

分类 学习记录 发表评论

望闻问切细则

2024年11月27日 作者 rejirshaoj

基本情况: 姓名:       &nbs … 阅读更多

分类 未分类 发表评论

Patient-Friendly Language and Format

2024年11月27日 作者 rejirshaoj

Generative Artificial Intelligence to Transform Inpatie … 阅读更多

分类 学习记录 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 下一页 →

近期文章

  • 智能体创建(CAMEL)
  • 智能体协议 MCP
  • 大模型发展历程
  • 论文分享(一)
  • Minimind复现文档

近期评论

  1. Yeeeeee 发表在 Easy Scraper
  © rayzark小屋 • 沪ICP备2024094782号