大语言模型微调及其应用的探索 跟踪前沿的技术
正确的层次关系:
Ollama是一个开源工具,旨在简化大型语言模型的本地化部署和使用,支持CPU/GPU混合计算,适用于隐私保护、成本控制等场景
6、深度神经网络之全批量梯度下降、随机梯度下降和小批量梯度下降(mini-batch size)
8、深度神经网络之参数优化(BatchNormaliztion)
分为三大步
pip install jupyter
pip install matplotlib
3. 交叉熵损失函数 torch.nn.funcational.cross_entropy(…)
9、优化器的设置 两项技术 temperature 和 TOP-K合作关系
