春节寒假作业辅导:基于 Rokid 灵珠平台打造 AI Glasses 作业助手

张开发
2026/4/10 11:30:58 15 分钟阅读

分享文章

春节寒假作业辅导:基于 Rokid 灵珠平台打造 AI Glasses 作业助手
本文应用基于Rokid灵珠智能体/CXR SDK开发开发指南https://forum.rokid.com/index文章目录一、引言为什么我们需要一个 AI Glasses 作业助手二、方案设计与架构2.1 核心功能定义2.2 端到端架构AI Glasses2.3 业务流程架构三、开发实战手把手搭建“作业救星”3.1 准备工作3.2 步骤一创建知识库资源准备3.3 步骤二创建智能体Agent3.4 步骤三搭建核心工作流Workflow3.4.1 变量与节点命名3.4.2 输出格式便于 AI Glasses 展示3.4.3 验收用例3.5 步骤四发布并在眼镜端体验AI Glasses 闭环四、总结一、引言为什么我们需要一个 AI Glasses 作业助手春节假期本是阖家团圆的日子但对于很多家长来说“辅导寒假作业”往往是打破祥和气氛的导火索。面对孩子“这题怎么做”的灵魂拷问家长们常常面临两个痛点知识遗忘当年的学霸面对现在的奥数题也可能束手无策。情绪失控反复讲解听不懂容易血压飙升。传统的搜题 App 需要掏出手机、拍照、上传不仅打断孩子思路还容易让孩子分心玩手机。而Rokid Glasses的第一视角采集与实时语音交互特性天然适合作为“随身家教”——看着题就能问边看边讲解。本文将详细介绍如何利用Rokid 灵珠 AI 平台的零代码/低代码能力快速搭建一个具备“识题讲解、知识点回顾、错题整理”的AI Glasses 应用形态为智能体 工作流可在眼镜端使用。二、方案设计与架构2.1 核心功能定义我们希望打造一个名为“作业救星 (Homework Savior)”的智能体它具备以下能力️ 视觉识别通过眼镜摄像头捕捉作业题目支持手写体/印刷体。 深度推理不直接给出答案而是分析题目考察的知识点提供分步解题思路。 知识挂载针对特定学科如初中几何、物理公式挂载专属知识库以提高准确率。️ 情感交互以“温柔耐心的学霸哥哥/姐姐”口吻进行语音讲解安抚孩子情绪。2.2 端到端架构AI Glasses请求触发卡片语音Rokid Glasses语音第一视角灵珠智能体工作流多模态理解OCR/题干提取知识库检索公式/定理/例题推理生成引导式讲解2.3 业务流程架构利用 Mermaid 绘制的业务流程图如下多模态大模型知识库 (Knowledge Base)工作流 (Workflow)灵珠 AI 平台 (Agent)用户 (Rokid Glasses)多模态大模型知识库 (Knowledge Base)工作流 (Workflow)灵珠 AI 平台 (Agent)用户 (Rokid Glasses)阶段一视觉理解与意图识别阶段二知识检索与推理语音指令这道几何题怎么做 拍摄题目图片触发主工作流 (Input: Query Image)调用视觉模型 (OCR 题目提取)返回题目文本 关键几何条件检索相关公式/定理 (如勾股定理)返回Top3相关知识片段Prompt: 结合题目知识点生成分步讲解思路返回结构化的讲解文本 (非直接答案)输出最终讲解内容语音播放讲解 屏幕显示关键公式三、开发实战手把手搭建“作业救星”3.1 准备工作登录Rokid 灵珠 AI 平台https://rizon.rokid.com/准备 3 份测试题目建议各 1 份几何、方程、应用题用于验证不同题型表现。准备一份“初中数学公式/定理”材料PDF/Markdown/网页内容均可用于构建知识库。确保眼镜与手机已完成基础配对/联网并能在眼镜端打开灵珠平台相关入口。3.2 步骤一创建知识库资源准备进入左侧导航的“资源”-“知识库”创建知识库初中数学公式与定理。上传/粘贴内容并切分为适合检索的片段建议按“定理名 公式 适用条件 例题提示”组织进行一次检索自测输入“勾股定理”“相似三角形判定”等关键词确认能命中对应片段。3.3 步骤二创建智能体Agent在灵珠平台首页点击“创建智能体”。基本信息配置名称作业救星简介你的寒假作业辅导老师只讲思路不给直接答案人设与回复逻辑Prompt在对应区域输入提示词# Role 你是一位耐心、幽默且知识渊博的清华学霸家教。你的目标是辅导初中生完成寒假作业。 # Constraints 1. **严禁直接给出最终答案**如“选A”或“等于5”。 2. ✅ 必须采用**引导式教学**先分析题目考点再提供第一步思路引导学生思考下一步。 3. ️ 语言风格轻松活泼多用鼓励性话语如“这点很棒”“别急我们慢慢来”。 4. 如果涉及数学公式请用 LaTeX 格式输出方便眼镜端渲染或转为自然语言描述。 # Skills 1. 擅长识别手写体题目。 2. 能将复杂的物理/数学概念用生活中的例子类比。3.4 步骤三搭建核心工作流Workflow为了处理复杂的“识图检索推理”逻辑我们需要使用工作流而非简单的单轮对话。进入“开发工作流”-“创建工作流”。3.4.1 变量与节点命名灵珠平台的工作流画布里开始节点默认会提供两类输入USER_INPUT文本输入用户的提问/指令USER_INPUT_IMAGE图片输入用户当前视角拍摄的题目图结束节点通常输出output工作流最终输出返回给智能体/眼镜端展示与播报为了让提示词里引用变量更直观建议把两个关键节点命名为题干提取负责 OCR/题面结构化知识库检索负责从知识库召回相关定理/公式节点编排示例开始节点默认输入USER_INPUT用户问题USER_INPUT_IMAGE题目图片题干提取大模型/多模态输入USER_INPUT_IMAGEPrompt请提取图片中的题目文字若含几何图请用要点描述图形关系与已知条件。知识库检索Query使用题干提取的输出题目文本配置选择我们提前创建的初中数学公式与定理知识库Top K设置为 3可按效果调到 5大模型推理节点 (LLM Generation)模型选择选择推理能力强的模型System Prompt你收到了一个学生的提问和一道题目。 题目内容{{题干提取.output}} 参考知识点{{知识库检索.output}} 用户问题{{USER_INPUT}} 请结合参考知识点为学生讲解这道题采用引导式教学不要给出最终答案或最终数值结果。 如果识别到的题干不完整/关键信息缺失 先用一句话复述你识别到的题干并告诉用户需要补充拍清楚哪些信息然后停止输出讲解。 否则请严格按以下结构输出每段控制简短方便眼镜端显示与语音播报 【考点】一句话概括 【第一步】先做什么给出一个可执行的小步骤 【下一步提示】给一个追问或提示推动学生继续 【自检问题】给 1 个让学生自检的简单问题结束节点输出变量将大模型推理节点输出映射到output3.4.2 输出格式便于 AI Glasses 展示为了保证“眼镜端一眼能看懂、语音也不啰嗦”建议把工作流最终输出固定为四段结构【考点】相似三角形判定与比例关系 【第一步】先在图中找出两组对应角或平行线形成的内错角判断能否构成相似 【下一步提示】如果能判定相似对应边成比例这一步你准备写出哪两条边的比例 【自检问题】你能说出“相似”的两个三角形分别是哪两个吗3.4.3 验收用例下面这张表是我自己用于“发布前验收”的最小集合。用例题目类型画面条件用户问题示例期望输出检查点TC-01几何有图光线正常这题第一步怎么看能说出考点不报答案给出可执行第一步TC-02方程印刷体光线正常帮我分析思路结构化四段第一步是列式/移项等TC-03应用题文字多题干完整先帮我提取已知条件能复述条件提示设未知数不直接算结果TC-04手写体字迹清晰我卡在第二步了能追问缺失信息或给下一步提示推动思考TC-05模糊/反光题干缺失你看得清吗先复述识别到的内容要求重拍停止讲解TC-06“诱导要答案”题干完整直接告诉我答案仍不报答案改为给思路与自检问题调试工作流点击“试运行”上传一张勾股定理的题目图片输入问题“这道题怎么求斜边”观察输出是否包含“根据勾股定理 (a2b2c^2)”等引导性内容3.5 步骤四发布并在眼镜端体验AI Glasses 闭环回到智能体配置页在“能力配置”-“工作流”中绑定刚才发布的“作业辅导工作流”。点击“发布”将权限设置为自己可用眼镜端体验流程佩戴 Rokid Glasses打开灵珠相关入口并唤起“作业救星”注视作业题目语音说这道题我不会做先告诉我第一步怎么想等待结果在眼镜端输出优先展示“考点 第一步 关键公式”并语音讲解四、总结通过 Rokid 灵珠平台我们用“智能体 工作流 知识库”的方式快速搭建出一个具备多模态理解与引导式讲解能力的AI Glasses 应用。它既能缓解春节期间的家庭作业辅导压力也能展示“AI 在穿戴设备上落地”的价值更自然的语音交互、更顺畅的所见即问、以及更专注的学习体验。下一步计划尝试接入Agent 记忆能力让它能记住孩子容易做错的题型下次遇到类似题目时主动提醒“这道题和你上次做错的那道很像哦要注意陷阱”

更多文章