登录注册写文章

2025-09-02月会总结

2025-09-02月会总结

每天早上9:30开晨会的机制改了之后，目前是周一周四同步日常事项，周三专项进展会议，另外每个月会有月会；所以目前可以说是每周对齐一次进展，每个月对齐一次这个月的目标达成情况。

0901开了这个月的月会，别人做的比较好的是：

RL和合成数据的质检是比较深入的，包括benchmark构建，算子的构建
多SOTA模型评估的适用性和范围是比较广的，也是有应用潜力的
模型端到端评测是新的比较有思考的方向

自己的工作不足的是：

人工标注辛苦一个月但是却发现RL和多模型都不大用的上，这是什么问题？
在文本Benchmark上的进展也比较少
全链路监控也是做的不够深入

回想一下自己在年初看data juicer的收获，其中的模型评测集的思路，以及清洗链路的思路其实都是在正确的方向。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

模型评测-evalscope
大模型测评手段多样，旨在全面评估模型的性能和能力。以下是一些主要的测评方法和维度：大模型评测方法分类表评测维度...
Li_MAX阅读 5,113评论 0赞 0
产品经理面试题总结
一、第一部分 1、在你过去的工作中，你是如何与开发团队合作的？请举例说明。考察意图：跨部门协作能力、沟通效率、...
是小李子呀阅读 1,450评论 0赞 1

2022-01-09-预训练技术在美团到店搜索广告中的应用
原文地址：预训练技术在美团到店搜索广告中的应用[https://tech.meituan.com/2021/12/...
破阵子沙场秋点兵阅读 3,751评论 0赞 0
人工智能：有多少人工，才能有多少智能？
最近大家都在聊AI，尤其大模型。但说句大实话，大模型当下的能力，那真是离不开大量人类智能（Human Intell...
程序元元阅读 23评论 0赞 0
AI基础知识总结
1 为什么要对特征做归一化特征归一化是将所有特征都统一到一个大致相同的数值区间内，通常为[0,1]。常用的特征归...
顾子豪阅读 5,660评论 0赞 1

友情链接更多精彩内容

赞1赞

赞赏

手机看全文