我的公司老了随笔十一月 26, 2025我的公司老了,尽管年纪不大,但真的老了老兵不会死去,只是凋亡最近在做一个项目的升级,可以称得上是技术框架在版本号上的大跃进,ubuntu20到ubuntu24,gcc8到gcc13,torchv1到torch2.9,tensort8到tensorrt10.14,cuda11到cuda13。本以为只是程序员gcctensorrtcudabazel
leetcode 3321. 计算子数组的 x-sum II (hard)leetcode十一月 15, 2025是leetcode每日一题跳出来的。咋看了一眼题就觉得很有趣,让我想到经典的类似题,如:维护一个队列中的中位数,具体题不记得了。计算子数组的x-sumII如之前所言,这题的题面就让人容易联想到维护滑动窗口中的中位数,维护中位数的做法是如何实现的呢,就是用一大一小个set,每次插入数据无脑往大的set双指针滑动窗口
英伟达之死...随笔十一月 10, 2025这只是一个平行世界的幻想,从某种意义上来说,你,我,我们,整个宇宙,终将逝去。序未来的某周二,NVIDIA死了。也许是周三,我们不知道。只见零散的媒体消息掠过:已经没人使用CUDA了,都用xxx了。这说明不了什么,可能NVIDIA周一就死了。英伟达的发家史二三十年前,那个穿皮衣的男人创建了一家公司,自由幻想
大语言模型 think budgetAI infer十月 26, 2025我不知道有多少人在使用思考模型,但笔者个人对思考模型的推理性能(性能吞吐)是极度不满意的,因此笔者一直避免使用思考模型,但人在江湖身不由己,有时候不得不使用思考模型。从OpenAI开始提出推理模型开始,思考模型已经逐渐成为了学界和业界的热点,国内开源模型两巨头qwen和deepseek,都有思考模式LLM servingsglang