Google BwA 杭州场（Gemma 4 专题全国首发）线下活动记录

张开发

• 2026/4/20 1:39:17 • 15 分钟阅读

分享文章

今天参加了Google BwA 杭州场Gemma 4 专题全国首发线下活动感觉挺有意思的。这篇文章简单总结一下活动的主要内容。关于MoE模型本地大模型的一大问题就是运行速度慢。会上说的让我比较印象深刻的一个点就是Gemma 4有多个版本其中26B版本的性能相比31B差距不大但是速度比31B快好几倍。原因是26B是MoE模型。26B完整名字是26B A4B这里的A4B指的是Active 4B也就是每次实际只激活4B参数B是Billion的缩写1B 10亿。我对大模型的实现了解不多所以问了一下ChatGPT对MoE模型给出了通俗的解释Gemma 4 模型微调活动中我们实际跟着老师做了两项任务。第一个任务是Gemma 4模型的微调这个任务代码放在一个叫hello-rocm的项目里面用于ROCM项目的入门科普。其中ROCM是一个类似CUDA的项目用于AMD显卡。https://github.com/datawhalechina/hello-rocm/blob/master/02-Fine-tune/models/Gemma4/01-Gemma4-E4B-LoRA及SwanLab可视化记录.ipynb下载了这个Notebook以后可以上传到Google Colab里面运行。Colab提供了远程高性能的 Jupyter Notebook 开发环境对于本地没有高性能开发环境的人来说很方便而且是免费的。https://colab.research.google.com/需要说明的是这里面用到了一个HF_TOKEN的环境变量需要去Hugging Face注册账号并创建一个access token然后设置到Colab的Secrets中。在Android Studio中使用Gemma 4开发Gemma 4可以在多种平台体验和使用。其中一种就是Android StudioAgent模式可以调用本地模型开发代码。下载LM Studio 或者 Ollama 安装对应的模型推荐Gemma 4 26B A4B。以LM Studio为例下载好模型以后切到Developer页面开启本地的端口就可以了。然后在Android Studio中按照官方文档去配置就行了。https://developer.android.com/studio/gemini/use-a-local-model?hlzh-cn但是我实际测试的时候遇到了一些问题Agent并没有按照我的要求去修改代码而是直接把代码输出来了需要我人工去复制粘贴我尝试换了提示词没有成功。但是现场看到有人使用时是正常工作的。总的来说感觉这个模型目前还不成熟。如果以后成熟了用这种本地模型去开发一些不那么复杂的代码还是可以的。常用的一种思路就是用比较强的大模型去对项目的整体结构先做一个完整的规划然后到具体的实现细节再让相对弱一些但是性价比高的模型去实现。下面是我实际运行的效果。这篇文章就简单总结到这里对这个活动感兴趣但是没机会参加的可以参考一下。如果觉得文章有帮助欢迎分享转发也欢迎关注我的公众号“搬砖的小明”及时获取更新

Google BwA 杭州场（Gemma 4 专题全国首发）线下活动记录

最新文章

3分钟快速上手merge-images：无需canvas的图像合成终极指南

从LLM到Agent：拆解AI大语言模型的基础工程概念全景图

开源逻辑分析器LogicAnalyzer：数字信号调试的终极指南

Autosar Nm-被动唤醒时一帧网管报文是如何发出的？

进程地址空间

当代码几乎免费时，程序员还剩下什么？

推荐文章

C++20中views的学习与实战练习

从Buck到LLC：一份用Pspice玩转SiC MOSFET四大经典拓扑的仿真实验手册

从零到一：MATLAB tf函数实战指南与进阶技巧

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

如何在苹果设备上运行Windows和Linux：UTM虚拟机完整指南

订单分库分表怎么设计？一次讲清拆分维度、全局 ID、分页查询与跨库问题

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

CS2交易保护新规，对市场有哪些影响，搬砖党何去何从？

Java第二周

学习分享数据结构对比

手把手教你用Vue2和原生JS复刻蓝桥杯真题：购物车与分页列表实战

计算机毕业设计 | vue+SpringBoot凌云在线阅读平台图书借阅管理系统(附源码)

为什么你的HR数字化项目总失败？AGI原生架构 vs 传统RPA的5维能力对比（附Gartner最新评估矩阵）

AGI监管风暴下的生存法则：2024年Q2全球12国AI法案穿透式解读与企业自检清单

【IdraScriptsParker】软件启动报错“Run-time error ‘429‘ :ActiveX component can‘ t create object”解决方案

用 AR 眼镜重构生活记忆：我做了一个「空间记忆管家」智能体

如何限制MongoDB副本集初始同步的网络带宽_maxSyncSourceLagSecs等参数

【紧急预警】当前92.3%的AGI认知架构存在注意力泄漏漏洞：3步检测法+实时防御补丁（附NASA验证代码）

Flink技术实践-FlinkSQL视图View避坑指南

Google BwA 杭州场（Gemma 4 专题全国首发）线下活动记录

最新文章

3分钟快速上手merge-images：无需canvas的图像合成终极指南

从LLM到Agent：拆解AI大语言模型的基础工程概念全景图

开源逻辑分析器LogicAnalyzer：数字信号调试的终极指南

Autosar Nm-被动唤醒时一帧网管报文是如何发出的？

进程地址空间

当代码几乎免费时，程序员还剩下什么？

推荐文章

C++20中views的学习与实战练习

从Buck到LLC：一份用Pspice玩转SiC MOSFET四大经典拓扑的仿真实验手册

从零到一：MATLAB tf函数实战指南与进阶技巧

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

如何在苹果设备上运行Windows和Linux：UTM虚拟机完整指南

订单分库分表怎么设计？一次讲清拆分维度、全局 ID、分页查询与跨库问题

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

DotNetPy：现代.NET 与 Python 互操作实战指南