当前位置:

人工智能

什么是 Prompt Engineering?
327 阅读
什么是MoE架构?
328 阅读
Zero-shot、One-shot、Few-shot 的区别
267 阅读
什么是MCP(大模型上下文协议)?
433 阅读
什么是混合精度训练(FP16、BF16)?
378 阅读
什么是批量归一化(BatchNorm)?
326 阅读
推理延迟和 Token 数量的关系
310 阅读
什么是 Self-RAG?
298 阅读
如何判断模型是否能部署在某显卡上
355 阅读
什么是 RAG(检索增强生成)?
364 阅读
RAG 能解决哪些大模型问题.docx
334 阅读
什么是 QPS(Queries per Second)?
320 阅读
什么是 DPO(Direct Preference Optimization)?
504 阅读
大模型常见面试题:什么是推理(Inference)?
367 阅读
大模型如何处理训练数据?
327 阅读
大模型常见面试题:什么是 KV Cache?
333 阅读
大模型基础面试题:什么是指令微调(SFT)?
395 阅读
大模型基础面试题:什么是梯度消失?
330 阅读
模型训练中常见的优化器有哪些?
388 阅读
什么是交叉熵(Cross Entropy)?
325 阅读
什么是残差连接(Residual)?
338 阅读
什么是位置编码(Positional Encoding)?.docx
462 阅读
前馈神经网络(FFN)在 Transformer 中有什么作用?
489 阅读
什么是损失函数(Loss)?
372 阅读