当前位置:

人工智能

大模型中的“对齐(Alignment)”是什么?
90 阅读
什么是大语言模型(LLM)?.docx
103 阅读
大模型中的“上下文窗口(Context Window)”是什么?
98 阅读
大模型中的“GRPO(Generative Rejection Preference Optimization)”是什么?
97 阅读
大模型中的“Scaling(扩展规律)”是什么?
91 阅读
大模型中的“MOE(Mixture of Experts)”是什么?
81 阅读
大模型中的“噪声(Noise)”是什么?
81 阅读
大模型中的“软标签(Soft Label)”是什么?
100 阅读
大模型中的“SFT”是什么?
92 阅读
大模型中的“RAG(Retrieval-Augmented Generation)”是什么?
102 阅读
大模型中的“微调”是什么?
80 阅读
大模型中的“CoT(Chain of Thought)”是什么?
130 阅读
大模型中的“RL(Reinforcement Learning)”是什么?
60 阅读
KV Cache 在训练和推理中的差异是什么?
115 阅读
挑一个你深入研究过的模型(比如 DeepSeek‑R1/Llama/Mistral/Qwen),聊聊架构特性、训练技巧和使用心得。
109 阅读
你在线上或离线训练时,过拟合怎么系统性处理?直接说你最有效的三个方法和拿到的收益。
113 阅读
把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。
103 阅读