机器学习之预测概率问题

张开发

• 2026/4/16 22:32:52 • 15 分钟阅读

分享文章

超清晰解释为什么两个正确率score数值不一样我直接给你讲最核心、最本质的原因保证你一看就懂你代码里这两行print(f正确率{estimator.score(x_train,y_train)})# 0.98print(f正确率:{accuracy_score(y_test,y_predict)})# 0.91一句话总结一个是“做过的题得分”一个是“没做过的新题得分”当然不一样1. 两个分数到底算的是什么①score(x_train, y_train)→训练集正确率 0.98用训练集数据打分模型早就见过这些数据已经学过了相当于拿课堂练习题考学生学生当然得分高②accuracy_score(y_test, y_predict)→测试集正确率 0.91用测试集数据打分模型从来没见过这些数据相当于拿全新期末考试卷考学生分数自然会比训练集低一点这才是模型真实能力2. 为什么训练集分数一定更高机器学习模型会努力记住训练集的规律甚至会记住训练集里的细节记住训练集里的噪声所以在自己学过的数据上表现极好。但测试集是全新数据模型不能“背答案”所以分数会更真实、更低、更有参考价值。3. 你的结果完全正常训练集正确率0.98 ✅ 正常见过的题测试集正确率0.91 ✅ 正常没见过的新题只要测试集正确率不是远低于训练集比如 0.98 vs 0.5就说明没有过拟合模型很健康。4. 最重要的结论一定要记住我们看模型好坏只看测试集分数0.91才是模型真实准确率0.98只是记忆分数不能代表模型能力5. 你代码里的小问题顺手帮你改你写的print(f正确率{estimator.score(x_train,y_train)})应该改成print(f训练集正确率{estimator.score(x_train,y_train)})print(f测试集正确率{accuracy_score(y_test,y_predict)})这样就不会混淆了。最终超级简单总结0.98模型做自己学过的题→ 分数高0.91模型做全新的考题→ 分数真实两个不一样完全正常机器学习必然现象

机器学习之预测概率问题

最新文章

深度模型在因果推断中的应用：从TarNet到VCNet的技术演进

从冯诺依曼到哈佛：深入浅出图解嵌入式CPU架构，以及它如何影响你的代码效率

给STM32F103的4.3寸屏找个新UI：手把手移植LVGL 7.11（附正点原子驱动适配）

2025最权威的AI学术助手实测分析

抖音无水印批量下载工具终极指南：免费快速保存视频、图集和用户作品

【Carla】Windows编译全流程避坑指南：从环境搭建到首次运行

推荐文章

PyCharm社区版+Anaconda环境配置全攻略（避坑指南+清华镜像加速）

企业架构实战：从BA到TA的4A架构全解析（附华为架构图参考）

ESP-Bootstrap：面向ESP32/ESP8266的嵌入式Web固件基础架构

实战 | 从模仿学习到强化学习：自动驾驶轨迹规划的范式演进与代码实现

基于计算机视觉的路口交通密度估计

一文搞懂 Python 的 GIL（全局解释器锁）

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

五代十国历史梳理（公元 907 年 —979 年）【五代】

51单片机C语言编程，别在数据类型上踩坑了！从char到sfr的保姆级避坑指南

如何快速解决QQ音乐格式兼容问题：完整音频解密操作指南

别再傻傻分不清了！钕铁硼磁铁Hcb和Hcj到底啥区别？选型避坑指南

告别选择困难！实测三大AI编程助手：Cursor、Windsurf、Copilot，哪个最适合你的项目？

STM32F407+LAN8720A以太网MAC层通讯避坑指南：从PHY硬复位到DMA描述符的实战心得

MATLAB中readmatrix函数的高级用法与实战场景解析

魔兽争霸3现代兼容性终极解决方案：WarcraftHelper完全指南

FUTURE POLICE模型Matlab接口调用与数据分析

Unity2018+TextMeshPro动态字体实战：解决中文生僻字渲染不全的3种方案

ffmpeg.wasm实战：手把手教你实现视频多音轨合成与精准插入（含性能优化建议）

Attention机制详解：从原理到中英翻译实战，让AI学会“划重点”

机器学习之预测概率问题

最新文章

深度模型在因果推断中的应用：从TarNet到VCNet的技术演进

从冯诺依曼到哈佛：深入浅出图解嵌入式CPU架构，以及它如何影响你的代码效率

给STM32F103的4.3寸屏找个新UI：手把手移植LVGL 7.11（附正点原子驱动适配）

2025最权威的AI学术助手实测分析

抖音无水印批量下载工具终极指南：免费快速保存视频、图集和用户作品

【Carla】Windows编译全流程避坑指南：从环境搭建到首次运行

推荐文章

PyCharm社区版+Anaconda环境配置全攻略（避坑指南+清华镜像加速）

企业架构实战：从BA到TA的4A架构全解析（附华为架构图参考）

ESP-Bootstrap：面向ESP32/ESP8266的嵌入式Web固件基础架构

实战 | 从模仿学习到强化学习：自动驾驶轨迹规划的范式演进与代码实现

基于计算机视觉的路口交通密度估计

一文搞懂 Python 的 GIL（全局解释器锁）

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

DotNetPy：现代.NET 与 Python 互操作实战指南