rejirshaoj – 第 2 页 – rayzark小屋

微调，强化学习，缩放

2025年4月15日作者 rejirshaoj

大语言模型中的强化学习则有很大不同。大语言模型不是从有限的行动集中选择，而是从庞大的词汇表中选择标记，并且它们 … 阅读更多

2025年3月3日作者 rejirshaoj

零基础入门：DeepSeek微调教程来了！

2025年2月5日作者 rejirshaoj

整个文本生成的 Transformer 模型可以分成三大块：把文字转成数字向量（让机器听懂我们的语言）。包 … 阅读更多

2024年12月11日2024年12月6日作者 rejirshaoj

挂载数据云盘、创建训练环境在webssh端输入lsblk 可以看到vdb是我们的数据云盘，没有分区，disk … 阅读更多

2024年12月2日作者 rejirshaoj

开发了TongGu，一个领先的垂直领域LLM，擅长管理广泛的CCU任务；设计了一个从文言文文本自动生成指令数 … 阅读更多

2024年12月1日作者 rejirshaoj

WenMind 是一个综合性基准测试，专门用于评估中国古典文学和语言艺术（CCLLA）中的大型语言模型（ … 阅读更多

2024年11月27日作者 rejirshaoj

首席情报官（Wiseflow） 🚀 首席情报官（Wiseflow）是一个敏捷的信息挖掘工具，可以从网站、微信公 … 阅读更多

2024年11月27日作者 rejirshaoj

背景简单来说，领域模型 / 专家模型就是在某一个专业领域性能特别好的模型，可能包括法律、医学、教育、rol … 阅读更多

2024年11月27日作者 rejirshaoj

基本情况：姓名： &nbs … 阅读更多

2024年11月27日作者 rejirshaoj

Generative Artificial Intelligence to Transform Inpatie … 阅读更多