依托Google Colab提供的免费T4 GPU算力,借助Unsloth工具,基于自定义数据集完成主流开源小语言模型的微调; 通过llama.cpp工具链将微调后的模型权重转换为GGUF格式; 将GGUF格式模型部署至Ollama平台,实现通过 ollama pull my-model 命令在任意终端调用模型,同时支持将 ...