打造本地文生图接口，ollama+diffusers让AI绘画更听话

张开发

• 2026/4/10 22:21:25 • 15 分钟阅读

分享文章

本文能帮你解决什么✅ 把本地AI绘画能力包装成标准REST API✅ 用ollama自动优化用户输入的中文提示词告别手动写英文长句✅ 基于diffusers加载dreamshaper8-lcm模型生成速度快、质量高✅ 配置CORS让同局域网下的手机、平板、电视都能调用你的服务主要内容脉络1️⃣ 为什么我要自己搭这套服务需求与背景2️⃣ 选型思路FastAPI ollama diffusers dreamshaper8-lcm3️⃣ 一步步动手实现附完整代码片段4️⃣ 避坑指南进阶优化建议第一部分问题与背景之前我一直用在线AI绘画平台但团队内部频繁使用既担心数据隐私又心疼费用。后来想不如用自己的机器跑开源模型然后做成API给前端调用需求很明确▪️ 接口要简单前端传一句“一只猫在太空里弹吉他”后端自动生成图片。▪️ 提示词要智能用户说人话就行后台帮我优化成适合Stable Diffusion的英文描述。▪️ 速度要快等太久体验就崩了所以需要支持快速生成模型。▪️ 局域网全设备可用手机、平板、甚至同事的Mac都能直接访问。所以技术栈就这么定了FastAPI高性能API框架 ollama本地运行大模型优化提示词 diffusers加载dreamshaper8-lcm模型。LCMLatent Consistency Model配合DreamShaper生成一张512x512的图只需要2-3步迭代速度起飞⚙️ 第二部分核心原理/步骤 ollama优化提示词ollama可以本地运行各种大模型我用的是qwen2.5:7b中文理解强。原理很简单写一个系统提示让大模型把用户输入的中文描述扩写成详细的英文提示词。比如用户输入“小猫”模型会输出“A cute fluffy kitten playing with a ball of yarn, soft lighting, photorealistic, 8k”。️ diffusers生成图片HuggingFace的diffusers库配合dreamshaper8-lcm模型这是微调过的版本支持LCM采样再用LCM-LoRA加速几步就能出图。注意要下载到本地避免每次重复拉取。 FastAPI CORSFastAPI天然支持异步性能好。CORS中间件配置允许所有来源开发时或者指定局域网IP段这样任何设备都能跨域请求。️ 第三部分实战演示代码可直接用别急着复制先看我标注的红字警告都是我自己踩过的坑1️⃣ 安装依赖uv add fastapi uvicorn diffusers transformers accelerate torch ollama pillow python-multipart注意torch最好根据你的CUDA版本安装否则可能跑在CPU上慢死。2️⃣ 编写ollama提示词优化函数import ollama def optimize_prompt(user_input: str) - str: system_prompt 你是一个AI绘画提示词优化专家。将用户输入的中文描述转化为详细、高质量的英文提示词适合Stable Diffusion使用。包含主体、细节、风格、光线等。只输出英文提示词不要解释。 response ollama.chat(modelqwen2.5:7b, messages[ {role: system, content: system_prompt}, {role: user, content: user_input} ]) return response[message][content].strip()⚠️ 第一次运行ollama会拉取模型确保网络通畅大概4GB左右耐心等。3️⃣ diffusers图像生成函数import torch from diffusers import AutoPipelineForText2Image from diffusers import LCMScheduler # 加载模型第一次会自动下载之后从缓存加载 pipe AutoPipelineForText2Image.from_pretrained( Lykon/dreamshaper-8-lcm, torch_dtypetorch.float16, variantfp16, safety_checkerNone # 为了速度可以禁用安全检查 ) pipe.scheduler LCMScheduler.from_config(pipe.scheduler.config) pipe.to(cuda) def generate_image(prompt: str, steps: int 4) - bytes: image pipe( promptprompt, num_inference_stepssteps, guidance_scale1.0, # LCM模型通常guidance scale较低 width512, height512 ).images[0] # 直接返回图片字节数据 from io import BytesIO img_byte_arr BytesIO() image.save(img_byte_arr, formatPNG) return img_byte_arr.getvalue() 踩坑提醒别忘了设置safety_checkerNone否则可能会卡在审核环节。还有guidance_scale要调低1.0左右就行太高反而模糊。4️⃣ FastAPI应用 CORS配置from fastapi import FastAPI, HTTPException from fastapi.middleware.cors import CORSMiddleware from pydantic import BaseModel from fastapi.responses import Response app FastAPI() # 允许所有局域网设备访问开发用 app.add_middleware( CORSMiddleware, allow_origins[*], # 上线前建议改为具体IP allow_credentialsTrue, allow_methods[*], allow_headers[*], ) class PromptRequest(BaseModel): prompt: str steps: int 4 app.post(/generate) async def generate(request: PromptRequest): try: # 1. 优化提示词 enhanced_prompt optimize_prompt(request.prompt) print(f优化后提示词: {enhanced_prompt}) # 日志方便调试 # 2. 生成图片 img_bytes generate_image(enhanced_prompt, request.steps) return Response(contentimg_bytes, media_typeimage/png) except Exception as e: raise HTTPException(status_code500, detailstr(e)) if __name__ __main__: import uvicorn uvicorn.run(app, host0.0.0.0, port8000) 注意host必须设为0.0.0.0才能监听所有网络接口让局域网其他设备访问。5️⃣ 测试你的接口运行python main.py然后在同一局域网下的手机或另一台电脑上执行curl -X POST http://你的电脑IP:8000/generate \ -H Content-Type: application/json \ -d {prompt: 一只戴眼镜的柴犬程序员在敲代码, steps: 4} \ --output test.png如果返回一张图片恭喜你成功了第四部分注意事项与进阶思考⚠️ 安全警告上面的代码直接开放了所有来源的CORS并且没有做任何认证。如果你的局域网有外人或者你一不小心暴露到公网就会被滥用。至少加个简单的令牌验证比如在Header里校验一个预共享的密钥。其他容易翻车的点▪️显存占用dreamshaper8-lcm加载后大概占用4GB显存生成时还会临时增加。如果你的卡只有4GB可能爆显存。可以尝试用CPU模式慢或者量化模型。▪️ollama超时大模型推理需要时间建议给ollama调用设置超时默认是无限的。如果并发高可以考虑用异步请求或缓存常用提示词。▪️并发处理目前的代码是串行的多个请求同时进来会排队。可以用FastAPI的BackgroundTasks或者消息队列优化但小心显存冲突。▪️路径不要写死模型下载默认在~/.cache/huggingface如果磁盘不够可以设置环境变量HF_HOME指定路径。我自己踩过最痛的坑是第一次运行时忘了把模型放到GPU结果CPU跑了半小时一张图都没出来…… 所以一定要检查pipe.to(cuda)是否生效。

更多文章

前端开发 2026/4/7 22:09:43

Mac百度网盘免费加速终极指南：告别龟速下载的完整解决方案

Mac百度网盘免费加速终极指南：告别龟速下载的完整解决方案【免费下载链接】BaiduNetdiskPlugin-macOS For macOS.百度网盘破解SVIP、下载速度限制~ 项目地址: https://gitcode.com/gh_mirrors/ba/BaiduNetdiskPlugin-macOS 还在为百度网盘缓慢的下载速度而…

用Qwen-Image做活动海报：输入文案直接出图，设计效率翻倍 1. 为什么选择Qwen-Image做海报设计海报设计一直是营销和活动策划中的重要环节，但传统设计流程往往耗时耗力。设计师需要反复修改文案、调整版式、优化视觉效果，一个简单…

张开发

前端开发 2026/4/10 21:41:25

Cogito-V1-Preview-Llama-3B与Dify集成：低代码构建AI应用平台

Cogito-V1-Preview-Llama-3B与Dify集成：低代码构建AI应用平台最近有不少朋友在问，手头有一个不错的开源模型，比如这个Cogito-V1-Preview-Llama-3B，怎么才能快速把它变成一个能用的应用，比如一个智能客服或者一个内容…

张开发

打造本地文生图接口，ollama+diffusers让AI绘画更听话

最新文章

【复试】408

Petalinux 2020.1 QSPI启动踩坑实录：手把手教你解决‘Bad data crc’和分区超限问题

Openclaw接入自动发文教程庇

【GUI-Agent】阶跃星辰 GUI-MCP 解读---()---GUI-MCP 整体架构炔

常见加密算法详解：分类、原理、优缺点及应用场景

C语言程序设计

推荐文章

LeetCode 700. Search in a Binary Search Tree 题解

Design Tokens：设计系统的 DNA

老旧设备重生：OpenCore Legacy Patcher系统焕新全指南

得意黑Smiley Sans字体高效部署实战指南

毕设日志26.4.4（2）:ds3231画板细节，中断引脚接法，去耦电容

LeetCode 92. Reverse Linked List II 题解

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

Mac百度网盘免费加速终极指南：告别龟速下载的完整解决方案

OCAuxiliaryTools：3步解决OpenCore配置难题的跨平台GUI工具

AI写教材技巧全解析，低查重教材快速编写的秘诀！

Windows 下 openclaw 安装

AWS容器服务终极指南：如何构建高效的DevOps容器化开发流程

新手福音：通过快马AI生成带详解注释的STM32 LED控制入门项目

基于MATLAB Robotics Toolbox的机械臂轨迹规划仿真与数据可视化分析

openclaw行为式AI重构：从昂贵Token到高效对象协作

智能温控新选择：让电脑静音又高效的风扇管理方案

3个维度解析Fluwx：跨平台微信集成解决方案助力商业增长

用Qwen-Image做活动海报：输入文案直接出图，设计效率翻倍

Cogito-V1-Preview-Llama-3B与Dify集成：低代码构建AI应用平台

打造本地文生图接口，ollama+diffusers让AI绘画更听话

最新文章

【复试】408

Petalinux 2020.1 QSPI启动踩坑实录：手把手教你解决‘Bad data crc’和分区超限问题

Openclaw接入自动发文教程庇

【GUI-Agent】阶跃星辰 GUI-MCP 解读---()---GUI-MCP 整体架构炔

常见加密算法详解：分类、原理、优缺点及应用场景

C语言程序设计

推荐文章

LeetCode 700. Search in a Binary Search Tree 题解

Design Tokens：设计系统的 DNA

老旧设备重生：OpenCore Legacy Patcher系统焕新全指南

得意黑Smiley Sans字体高效部署实战指南

毕设日志26.4.4（2）:ds3231画板细节，中断引脚接法，去耦电容

LeetCode 92. Reverse Linked List II 题解

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

DotNetPy：现代.NET 与 Python 互操作实战指南