2025年纪实:在大模型训推平台、大/小模型训练与山河之间
2025年,
做了几件“有点意思”的事:
为了配得上‘AI年代’这个微信名, 给自行车写AI模型预测保养时间,
在零下30℃的东北(本命年)穿红袜子,
还给大模型写了训练数据校验工具,也开发了训练数据生成工具,
以盘古大模型为基座,打造某部委首个行业大模型,开启政务智能化新篇章,
新年将至。在“秀字辈同脉一家亲”群里大哥们热议排行之际,趁2026年钟声未响,用 Vibe Coding 半小时写了个小工具——按农历生日排座次,亲兄弟关系一目了然。血脉相连,代码亦可传情。
—— 技术很硬,生活很软。
🚴通勤路上的AI实验
每天清晨,骑车穿过北清路,西山轮廓清晰,月亮常挂在山尖。
我的老电脑,虽跑不动百亿参数大模型,但写脚本、跑小模型、画loss曲线,从没掉过链子。
今年的第一个项目,就是给我的‘小黄蜂’自行车开发了一个保养预测小模型!
它能根据骑行路线(坡度、路况、里程)判断链条、轮胎啥时候该维护。
大模型背后:我在做“看不见的基建”
很多人只看到大模型的惊艳回答,但少有人关注:高质量训练数据从哪来?模型怎么稳定训练?
2025年,我深度参与了公司大模型训推平台的能力建设。
这个平台不只是“能跑模型”,而是:
- 支持从数据清洗 → 微调 → 评估 → 部署的全流程;
- 支持当今全球最领先的技术和昇腾NPU/Nvidia GPU资源进行大模型训练和部署;
- 提供训练过程可视化、日志追踪、异常告警。
另外开发了一款 “大模型训练数据校验工具”。
它能自动识别数据中的格式错误,听起来枯燥?几十万token的训练数据人工排查15天,这个工具仅需要几十秒,让我们的训练数据准备周期压缩20%——好模型,得从干净的数据开始。
小模型:专治“GPU养不起”的客户
不止大模型。
很多客户说:“你们的大模型效果很好,但我们买不起百万起的GPU服务器,也等不起5秒响应。”
行,那咱们就做垂直领域的“专家小模型”!
比如在时序预测场景、工业质检场景,我们重点验证了 PatchCore 和 PaDiM 算法:
- 只需正常样本就能训练(工厂哪来那么多缺陷品?)
- 模型体积小(几十MB),纯CPU也能跑;
- 支持像素级缺陷定位(segmentation),不只说“坏了”,还指“坏在哪”。
能嵌入客户现有系统,通过API或容器化部署,甚至跑在边缘盒子上。
“它不像大模型啥都懂但啥都贵,而是像老师傅——只盯一个环节,又快、又准、还不贵。”
国产算力 & 高可用:从比赛到生产
去年参加“鼎新杯”信创数据库迁移比赛,今年直接把经验用上了!
用华为DRS数据复制服务,搭建了“异地主备 + 三只读库”的RDS架构:
- 主库挂了?备库秒级接管;
- 流量暴增?只读库分担压力,主库不再“喘不过气”。
另外,参加了昇腾云脱产培训,亲手在8卡昇腾服务器上跑满NPU。
虽然那台NPU服务器价格“令人清醒”,但在国产AI生态上实践也值了。
山河行旅:代码之外,皆是风景
技术再忙,也不能忘了看世界。
- 春节回齐齐哈尔,裹着一身红衣(红线衣、红内裤、红袜子……)对抗-30℃严寒;
- 七月,汾河岸边散步,水清桥美,柳枝拂面;
- 走进晋祠,看千年古木与宋代彩塑,在光影交错中感受时间的重量;
- 返程飞机上,舷窗贴着小国旗,突然觉得“回家”二字,重若千钧。
最神奇的是某天电脑锁屏——微软推送的壁纸,竟是我路过多次的大连跨海大桥。
世界有时候,就是这么爱悄悄给你意外。
生活的微光,最暖
- 同事送的发财树,如今枝繁叶茂;
- 取快递偶遇一只慵懒橘猫,它看我,我看它,谁也没说话;
- 小区门口放露天电影,坐在小板凳上看《流浪地球》,仿佛回到童年;
- 作为父亲,我第一次在爸爸生日时亲自去买蛋糕;而我的女儿拿了奖学金,第一件事竟是给我们发红包……
——
这大概就是,人间值得。
10月人生第一次拔牙,居然比大模型训练调参还紧张。
身份多重,初心不变
这一年,我作为骑手:北京卖了3辆自行车,在晋城买了一辆自行车。
这一年,我家的“程序媛”,还是:
- 班主任:在新生军训汇演中,作为国旗护卫队护旗手走过操场;
2026龙马精神,继续赶路
正文
工作电脑 lenovo 昭阳 K14
上班的路上,在接近西山的北清路上,月亮挂在山尖。

为我的小黄蜂自行车开发了一个模型,预测下一次的保养时间,可以根据骑行路线分类预测。


一年一度的春运抢票,还算幸运多段的车票只有一张后补并且半天后成功。

自己编写代码并画图化对比不同Learning rate和Epoch的模型训练效果。

本命年变成了红孩儿。

年三十的丰盛午饭。

巳巳如意。

大年初二,大连北站候车。

由于天气原因在铁岭西晚点25分钟,第一次高铁晚点20多分钟。

齐齐哈尔有给备上了红内衣。一身的红衣服:红线衣、红背心、红内裤、红线裤、红腰带、红袜子、红拖鞋。

东北早上8点的温度。

返程的火车票很难买,坐上南辕北辙的火车,刚刚出齐齐哈尔,向富裕方向行进。

DeepSeek爆火,在我的电脑上安装1.5B版本。

花了几个小时写的文件校验工具,使用了Java的Swing的富客户端工具。

流光大道。

损失函数和他的导数。

去年参加鼎新杯的信创数据库迁移比赛,今天又使用了华为的DRS数据复制服务,不差钱儿创建了RDS数据库异地主备模式,同时配了3个只读数据库。
一旦主库故障,备库秒级接管保障业务尽量不中断。而只读数据库则像高效助手,分担主库读压力应对高并发。


晚上溜山回城。

左下角白玉兰已开,又飘雪。

这次降雪,形成了远处的雪山


麦苗。

同事送的发财树。


单位楼下球场,有很多小朋友在训练。

从住处的露台,远眺中国尊


五一大连。

我爸养的花。

小杏子。

我的高中学生证。


我爸过生日。

华为5G实验室。

我编写的盘古大模型训练数据校验工具。

光影交错的大桥夕阳

领导从北京返齐。

新修好的北清路

小区门口的露天电影。

为期一周昇腾云脱产培训。

学院方队引导员。

夕阳夕照。




开始模型训练,NPU及显存跑满了。

8卡昇腾服务器价格昂贵。

我的自行车上了一个捡来的电动车牌照。

7月18日汾河岸边




7月26晋祠



在马场开会,都是名贵的好马。





汾河边的桥。

网红打卡地,太原的长安街。


日落的晋阳桥。

原来的豪宅。



8月31日山西省博物院。




9月1日新买的电脑,有8G 5060显卡。

大学生作为计算机1班的班主任,在新生军训汇演中,作为国旗护卫队护旗手身份入场。

我参加太原师范学院的培训,正好新生开学。

从学校回来的路上,看见了安宁西街,跟我们学校的安宁西路类似。

公司户外活动,看见的窑洞。


国庆前夕的迎泽大街网红桥,红旗招展。





国庆回东北的飞机上,贴着国旗。

登家旁边的山。



电脑锁屏微软随机显示壁纸,居然是我路过多次的大连跨海大桥。

第一次拔牙

10月31日大学生得了奖学金,给父母每人发红包。


晋祠公园















11月15日周六发现一个赶集的好地方,还有宠物市场


11月16日
太原古县城











400-939-787,最后一天通过GUI大模型识别屏幕截图。

{
"thought": "用户想要打开Python的开发工具。在截图中,我看到了一个名为'PyCharm'的图标,这是Python最受欢迎的集成开发环境之一。因此,下一步应该是点击这个图标来启动PyCharm。",
"action": "CLICK",
"parameters": {
"x": [132,
"y": 170],
"description": "PyCharm图标"
}
}
新年将至。在“秀字辈同脉一家亲”群里大哥们热议排行之际,趁2026年钟声未响,用 Vibe Coding 半小时写了个小工具——按农历生日排座次,亲兄弟关系一目了然。血脉相连,代码亦可传情。
