今天太阳艳丽,气温也有了回升,最高温度有摄氏23度。
下午与闺蜜约好去走公园,如此好天气,又是节假日,公园里有许多人。公园门口有不少商贩推着小车在售卖吃食,有卖现榨甘蔗汁的,有卖煎饼、煎鸡蛋的,还有卖糖等零食的。平时公园门口是不能卖东西的,可能是过年,城管放宽了管理,给小贩一些挣钱机会吧。
公园的湖边有不少人散步,水边的树上停歇了许多白鹭鸟,水中有白色的鹅,还有黑色的天鹅,引来人们驻足观赏、拍照。
这几天过年,都是在家中吃喝玩乐,追剧,时常由此熬夜,打乱了平时的生活节奏,应该慢慢回归正常状态才好。吃得多,运动得少,觉得又胖了不少。
这几天听的新闻也不少,最让人兴奋的是,DeepSeek ,全称杭州深度求索人工智能基础技术研究有限公司。 DeepSeek 是一家创新型科技公司,成立于2023年7月17日,使用数据蒸馏技术,得到更为精炼、有用的数据。由知名私募巨头幻方量化孕育而生,专注于开发先进的大语言模型( LLM )和相关技术。
该公司最近有了新的突破,DeepSeek 的大语言模型可以用更少的显卡且更快地进行模型训练。2025年1月20日, DeepSeek 正式发布 DeepSeek -R1模型,并同步开源模型权重。 DeepSeek -R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。 DeepSeek -V3和 DeepSeek -R1两款大模型,成本价格低廉,性能与 OpenAl 相当,让硅谷震惊,甚至引发了 Meta 内部的恐慌,工程师们开始连夜尝试复制 DeepSeek 的成果。
DeepSeek 的成果让中国人喜悦,令美国人震惊,让其刚刚启动的星际之门变得似乎没有想象的那么有意义。中国人在 AI 科技方面,迈出了重要的一步。
我将此信息告知女儿,让其可以在使用 Chat GPT -4时,关注比较使用 DeepSeek 。这个信息是春节期间最值得一提的事情。