当前位置:

人工智能

什么是 DPO(Direct Preference Optimization)?
102 阅读
大模型常见面试题:什么是推理(Inference)?
109 阅读
大模型如何处理训练数据?
90 阅读
大模型常见面试题:什么是 KV Cache?
81 阅读
大模型基础面试题:什么是指令微调(SFT)?
99 阅读
大模型基础面试题:什么是梯度消失?
73 阅读
模型训练中常见的优化器有哪些?
91 阅读
什么是交叉熵(Cross Entropy)?
76 阅读
什么是残差连接(Residual)?
81 阅读
什么是位置编码(Positional Encoding)?.docx
116 阅读
前馈神经网络(FFN)在 Transformer 中有什么作用?
117 阅读
什么是损失函数(Loss)?
100 阅读
什么是 Self-Attention?
89 阅读
为什么要使用多头注意力(Multi-head Attention)?
94 阅读
大模型基础面试题:什么是 Attention 机制?
73 阅读
大模型基础面试题:什么是 Prompt?为什么提示词能影响模型回答?
102 阅读
大模型基础面试题:什么是 Embedding?
104 阅读
大模型与传统机器学习模型的区别是什么?
77 阅读
为什么 Transformer 能取代 RNN?
95 阅读
什么是 Transformer 架构?
98 阅读
大模型基础面试题:什么是预训练?
108 阅读
什么是参数量,比如7B、13B是什么意思?
84 阅读
大模型中的“泛化(Generalization)”是什么?
112 阅读
大模型中的“温度(Temperature)”是什么?
87 阅读