2025 年寒假之后

去年博士入学之后,我就在北京上学,而 00 就在东莞工作。异地的日子 00 经常 emo。每过一段时间我就会飞去东莞找 00,然后就是一起尝试各种奇奇怪怪的体验,比如吃狗肉,买很贵的电竞椅,打游戏,买新的娃,看电影,租车自驾游。当然还有做了各种不同的食物。有披萨,面包,土豆丁,黄金炒饭,土豆丁,咖啡,奶茶,牛排,苦瓜炒蛋,干捞方便面,火锅,等等。 新年 今年新年跟 00 会她老家过年。在那里待一周,然后回来深圳继续待着,到 2 月 16 日开学再回去北京。 快要回去过年的时候,我 26 号把两侧的头发剪了,不盖下来了,尝试一下新风格。 1 月 27 日我们一起从深圳做高铁去武汉的。之后一起去一个酒店跟 00 的一些亲戚见面。吃完一顿饭之后,就是坐车回去应城。是 00 开车的,她父母好像有点不放心。回到应城之后 (待续)

March 23, 2025 · 1 min · 陈英发 Yingfa Chen

阿联酋之旅

现在是 2025 年 3 月 23 日,凌晨 2 点。离上次写博客已经有差不多半年了。中间跟 00 一起去了阿联酋参加学术会议。寒假跟 00 会她老家过年,在她家里住了一个星期。见识了很多本地的风俗,感觉跟想象中有一点点不一样,算是个神奇的体验。 因为值得记录的经历真的太多了,这篇文章只能先写下去年国庆之后,到我们一起去阿联酋的这段时间。下一篇会补充我跟 00 回家过年以及之后的经历。 阿联酋 【行程规划文档】:https://www.wolai.com/5qKxFofXAnQoGP4Cnpxze7 之前楚简论文中了 COLING 2025,它开在阿联酋,阿布扎比。我跟 00 就商量好了,一起去玩耍。我们的行程是这样的: 1 月 18 日:晚上,北京飞迪拜,晚上快凌晨到达迪拜。 1 月 19 日:迪拜自由活动。先逛了一下古城,然后坐地铁去哈利法塔。之后坐巴士去一个清真寺,然后逛了一下海边的度假村。晚上去棕榈岛。 1 月 20 日:早上坐船对面的黄金市场和香水市场。然后坐船回来继续逛了古街。之后就去坐大巴到阿布扎比,三个小时的车程。晚上到了之后,在路边店吃了烧烤,然后逛街直到海边。之后就是步行回去九点。 1 月 21 日:早上去了海边一个搬到,先到一个商场喝了咖啡,吃了麦当劳。然后逛了一个古村,摸了一个骆驼。之后去了总统府。傍晚去了大清真寺,00 需要带头巾才能进去。晚上在酒店旁边的一个路边小店,又吃了烧烤 😂。 1 月 22 日:早上去了一个酒店旁边的印度小店,吃了一些甜点和饼干。然后就是坐车回去迪拜,再去机场,然后飞回去北京。 18 日:北京飞迪拜 00 先飞过来北京,然后还过来学校一趟,到了我的宿舍,看到了大白。然后我们就一起去机场。00 带上了猫三! 19 日:迪拜的第一天 这时候是冬天,所以阿联酋的温度比较舒适。迪拜我们选择住在一个古城里面。因为是专门给游客设计的,所以比较干净舒适。 20 日:去阿布扎比 早上先去了河对面的黄金市场和香水市场。 (待续)

March 22, 2025 · 1 min · 陈英发 Yingfa Chen

VS Code 等宽字体的问题

在 VS Code 中,中英混用的时候会发现字体没有对齐。VS Code 官方说法是,渲染字体的方式是 Chromium 决定的,所以他们无法解决这个问题,他们推荐我们自行找中文等宽的字体。网上最常见的说法是用叫做 Sarasa-Gothic 的字体(中文是「更纱黑体」)。可是这个字体不仅巨大,还有点丑,名字我也不喜欢。还好找到了一个更符合我要求的字体:Ubuntu Mono。 它不仅符合我对字体的最低要求: 美观(这个很主观) 等宽 中英字符对齐 能很好地区分 iIl1, oO0, :;.,, '"‘’“” (指引号和弯引号) 还有其他优点:用 open-tail 的 g (看 Figure 1)。唯一的缺点就是 m 比较丑。 下载和使用 下载完之后,导入系统的字体目录。然后在 VS Code 的 settings 里面加上 { // ... "editor.fontFamily": "'Ubuntu Mono'", // ... } 默认下中文字体应该会 fallback 到黑体,如果没有的话,你把 'Ubuntu Mono' 改成 'Ubuntu Mono', 黑体 就行。注意引号。 ...

December 3, 2024 · 1 min · 陈英发 Yingfa Chen

2024 国庆之后

刚刚放完 🇨🇳 国庆假,从东莞回来了北京继续我的博士生涯。这几个月感觉事情特别多,虽然很充实,但也很累,刚好这个七天长假(实际只有五天)可以让我喘口气。很久没有写博客了,上一次关于我自己的博客内容好像就是去年国庆之后的。刚好过一年,也可以当作一个年度总结吧。 今年最主要的几件事情如下。 从硕士变成了博士。 女朋友毕业后,去了东莞工作,并且跟她一起建设了一个小家,也把娃基本都带过去了(现在我宿舍只剩下大白和两个猪)。 女朋友跟我一起回挪威见我的家长了,也是她第一次出国。 家人来了中国参加我的毕业典礼,顺便和女朋友家人见了面,定了亲。 当上了实验室里的研究小组组长,参与了公司的运行,很有打工人的感觉。 认识了很多做科研的人,对科研的认知进步了超级多,也看了超级多论文,找到了自己喜欢的小领域,感觉得心应手,idea 也超级多。 当上了 NLP 课的助教,是一个很有意思的体验。 科研篇 去年暑假被一位学姐拉到导师公司坐着,因为环境好又有钱,然后后面就顺理成章跟她一起做了科研项目,进入了新的小组(刚好一直带我的学长也快要毕业了)。后面,好像是五月份左右,这边的小组组长因为要出去实习,让我当上了组长,感觉非常不一样,一开始压力还挺大的,也觉得自己能力不够,德不配位。但是其实还行,大家也都是为了做科研而已,就是多了很多跟别的组拉扯的情况。同时,来到这边之后找到了自己的新方向了:RNN 和长文本。特别喜欢这种,有点小众,同时还影响力挺大的研究方向,就是一开始看论文有点吃力,毕竟很多基础理论跟现在火热的 Transformer 有比较大的出入,研究难点也很不一样。但是这样才好,同行少一点,看论文的压力也少一点(顺便吐槽一下,现在论文真的太多了,每次放完假都觉得错过了无数篇论文!)。另外,这段时间也把楚简论文投了 ARR,评分不是很好最近就改投 COLING 了。同时也挂了 arXiv,但是这种工作感觉影响力就不是很大,虽然也是首个相关数据集,肯定能拿到一些引用的。感觉我数据集的工作还挺多的,哈哈哈哈哈。 同时这段时间还结束了之前一直做的工作,比如知识编辑的工作中了 COLING。我作为二作的 $\infty$-Bench 和双工交互模型也结束了,分别中了 ACL 和 EMNLP,都挺不错的,引用也很不错,抱上大腿了哈哈哈哈。 博士开始 这个暑假后我从硕士变成了博士了,名义上是普博,但是感觉在我实验室的人眼中我就是直博的。把中文和古文字相关的工作都放到硕士论文里面了,我的博士论文就是 long-context 和 continual learning 了。感觉也挺好的,喜欢这种环境的变化,感觉可以让我有点重获新生、保持新鲜感的感觉。同时还活的了新的宿舍,22 号楼,室友还是原来的。新装修的,环境不错,但是洗澡的地方有点恶心。 前几天 10 月 2 日投了 ICLR,Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling,是我感觉比较满意的一个研究工作,做了也很久,感觉影响力应该会不错。然后今天凌晨两点把它放到 arXiv,争取一下靠前一点的位置。后面会单独写一篇博客整理和介绍。但是这篇工作只是开胃菜,是一个关于模型记忆能力的探索和一些崩溃现象的分析,后面还是得做实际的模型改动来提高模型性能,这才是我向往代表性工作,但是还是挺难的,虽然说 idea 很多,但是机器学习的研究就是一个反复试错的过程,大部分结果还是会跟猜想有很大的出入的。老师想要我训一个很强的 Mamba 版 MiniCPM,但是我觉得不做结构上的改动的这种训练没有什么科学贡献,个人还是希望做科学贡献,哈哈哈哈哈。 生活篇 之前最后一年跟 00 在学校每天都会见面,玩耍。 国庆结束后没多久我们就 10 月 27 日到 31 日一起去了东莞参观公司,感觉环境很不错,就是东莞这个城市很破旧,人均素质也挺低。没办法。29 日去了深圳玩,见了已经工作了的于泽华和 00 的堂姐。11 月 17 日,跟 00 去了孝感市的安陆市参加她高中同学,金洁,的婚礼,好羡慕人家可以这么早结婚。但是习俗确实好麻烦……后面 00 找了个实习,是【比特大陆】,在丰台区,中关村壹号对面,离我们实验室相关公司的【启元实验室】挺接近的。有时候我也会去启元上班,然后就可以一起下班了。 ...

October 10, 2024 · 1 min · 陈英发 Yingfa Chen

2023 年中秋和国庆

今年国庆 🇨🇳 和中秋 🥮 一起放假,我跟 00 一起回来应城参加她堂姐和初中同学的婚礼^[27号是初中同学(魏陈)的婚礼,5号是堂姐(骆卓颖)的婚礼。], 住在她家里十个夜晚^[九月二十六日回来,十月七日走。坐高铁到北京,然后做火车到应城。]。第二次见家长,也算是挺顺利,但是每天都会见到陌生人,有点累,庆幸的是,感觉到 00 能接受跟我家人生活在一起。一号到三号我们去武汉玩了三天,超级开心,跟她在一起连逛商场都是开心的! 小县城的氛围 应城跟我想象中的小县城很像,也是很多远房亲戚,习俗也让人很烦。敬酒、随地扔垃圾、室内抽烟、八卦人家的私事、说话粗鄙、脏、说了不要还非要给人家……而且确实能明显感觉到,这里的人的素质的平均水平挺低的,尤其是上一辈。真的很讨厌吃席,00 也是,这些习俗的麻烦程度让 00 都不想结婚了…… 但是无所谓了,之后能跟 00 在一起就好,除了回来过节应该也很少机会有联系。 武汉 一号到三号去了武汉旅游。早上五点多跟 00 的 ”二妈“(其实是婶,叔叔的老婆)坐车去武汉,坐了一个小时。他们这么早是因为要去谈婚礼的事情,然后害怕堵车。我们在酒店旁边下来,那时候“二妈”下地铁站上厕所,然后 00 非要给她买包子(为了礼貌),然后她最后还是拒绝了,导致我们得自己吃下包子。虽然包子没有不好吃,但是我就很讨厌这种明知人家不要还非要买的行为。 之后我们去酒店的时候,还没有房子,我们寄存了行李就直接去新天地买了杯霸王茶姬的奶茶,然后去了古德寺。网上说不可以穿着暴露,但是感觉路人穿着还是很暴露。 之后还去了解放公园和中山公园,都挺不错的。大城市就是好。里面看到了很好看的建筑物。在中山公园我们问了两个小孩借用羽毛球拍子来打了几下。之后在一个相亲角^[之前在上海都没找到。]旁边跟她的高中同学,彭双,会合,然后逛了一下相亲角。之后我们还坐了一下过山车(公园里面有过山车还是第一次见)。 晚上就去跟她的高中同学一起吃饭。 第二天我们先在地铁站剪了头发,然后去宝通寺,晚上去武商梦时代。这个商场规格超级高,还挺好玩的。第一次看到索尼专卖店,还有 Pico 专卖店。里面还有滑雪的地方,但是太贵的。我们还去了优衣库,买了一些衣服,发现还挺便宜的。以前都会觉得逛街购物很无聊,但是跟她在一起连连逛街买衣服都是开心的。 晚上我们跟她“大哥”(其实是堂哥)和他老婆一起吃饭,吃了魔宗烤肉,然后喝了茶颜悦色。总体来说也挺顺利的,感觉他们也不难相处。 第三天我们去了欢乐谷!是我们第一次一起去游乐场!玩了一个过山车,然后做了太阳飞车,00 就头晕想吐了,果然还是不行……但是没事,还是挺开心的。排队过程中还遇到了插队的人,好恶心! 晚上我们跟一些人(共七个人)一起拼车回来应城,居然比火车还便宜,不错。回来已经11点了,然后回家放下行李箱之后又出去找她初中同学一起吃宵夜。 公事 这个假期有点长,感觉有很多活都没有干。每天都很多事情,感觉这里的人太闲了,应该让他们多上班哈哈哈。古文字翻译的工作还没有干完,目前感觉效果不是很好,我也不想干这个了,感觉很浪费我的时间……至于对齐神经元,貌似现有方法都无法用在自回归模型上面,但是对齐问题好像之后自回归模型才会出现。不知道是不是我没有找到,目前还没有找到一篇研究神经元对生成结果的影响的工作。ROME 的 Causal Tracing 感觉可以用,这两天得赶紧做点东西出来。

October 5, 2023 · 1 min · 陈英发 Yingfa Chen

更新个人主页

之前有过个人主页,但是一直没有弄好,更没有更新。最近我将自己的 GitHub 的用户名改了,导致之前的 GitHub Pages 失效了,就趁机重新搭建个人主页。 兜兜转转,还是决定使用 Hexo。以前用过 Jekyll,觉得还行,但是真的不想用 Ruby,Hugo 又太麻烦。 选了好久主题,Hexo 宣传说有很多主题,但是官网上不到 400 个主题,而且大部分都不符合我的审美或者要求。我想要的风格是简约,现代,需要同时支持黑暗和白亮模式,需要有代码高亮且是代码是等款字体。最接近我的要求就是Maple主题。可是仍然无法满足我的要求,所以我修改了一些格式(原版甚至有一些颜色 bug),添加了自己的一些内容,结果是一个叫做枫叶的主题。 日记 今天早上七点半起来 🛏,打电话 📱 叫醒00(终于有一次是我打电话了哈哈哈哈),然后去核研院俱乐部在综体打羽毛球 🏸,后来发现他们其实约了西体,但是我跟00自己在蹭一个空场就不管了,八点半左右有人来了我们就去过早,然后去我宿舍 🏡。 之后点了库迪,然后去了学校南边的一个超市,买了一大包薯片和一个榴莲!然后就在宿舍没有吃午饭,直接待到晚饭。中午的时候还拍了视频 📷,中间还差点说到00emo了,哈哈哈哈。 今天 00 下午四点和晚上七点都有直播课 👩🏻‍🏫,都是真正开课,下午的在我宿舍开的,好像很成功,虽然拖堂了一点点。晚上的在她自己宿舍,貌似也拖堂了,00 说有好多人。 晚上九点去打羽毛球了 🏸,带上相机录了打球的视频,然后回去洗澡,晚上去林大北路的家 🏡。 最近 最近好忙,新学期马上就要开始了,这里总结一下暑假开始到此比较重要的事情吧。 这个暑假搬出校又搬回来了,折腾了又费钱 💰,学校真的好恶心,之前说了大概率是不会有宿舍,现在就有很多空的房间。 期末前跟导师确定了要读博了,我跟他我想要三年毕业,他说没有问题,希望真的是可以吧,我们实验室好像基本都是直博生,普博的应该都是四年吧。00 也确定了不会读博了,最近在投简历,Oppo 好像已经拿到了 offer,但是他们北京没有部门,所以 00 不想去,我也不想她去。好像互联网以外很多公司都不在北京…… 我的论文 📃 EREN(本来想叫做 EmoRen 的 😂)投出去了,上周 rebuttal 结果出来了,不是很理想,本来 soundess 是 433,Excitement 323,rebuttal 结束后第一个审稿人将 soundness 调低了。学长说主会议估计没有机会了,Findings 还有希望,我其实无所谓是不是 Findings,感觉学长反而有点介意。 被实验室的学长学姐拉去面壁智能1去干活,跟公司的业务没啥关系,就是把我的工位搬了,可能不想占用隔壁实验室的位置吧 😂 但是我真的不想去 😭 不能跟 00 待在一起了。我现在就是一周可能去两三天 😂 ...

September 16, 2023 · 1 min · 陈英发 Yingfa Chen

Some Binary Search

A binary search with C++: template<class T> int bin_search(vector<T>& arr, T target) { int left = 0, right = arr.size() - 1; while (left <= right) { int mid = (left + right) / 2; if (arr[mid] == target) { break; } else if (arr[mid] < target) { left = mid + 1; } else { right = mid - 1; } } return left; } The same thing with Rust: fn bin_search<T: Ord>(arr: &Vec<T>, target: &T) -> usize { let mut left = 0; let mut right = arr.len() - 1; while left <= right { let mid = (left + right) / 2; if arr[mid] == *target { break; } else if arr[mid] < *target { left = mid + 1; } else { right = mid - 1; } } left } And with Python: ...

September 14, 2023 · 1 min

临近2023暑假,00师姐答辩,晚上打球

今天睡到九点才醒来,还是被00打电话叫醒的。去过了个早,然后去上《深度学习》。 今天00的师姐答辩,下午三点去了,当时我在睡午觉。感觉之后她有点emo,但是她不承认,不知道为什么。然后聊了很多关于未来,结婚、生孩子、找工作等事情。感觉也没有很大的问题,但是00总是把东西看得很灰暗,很焦虑。

May 18, 2023 · 1 min · Chen Yingfa

第一个帖子,瞎写点东西

现在是 2023 年五月十七,马上硕士一年级就结束,在清华园已经快五年了,感觉对我人生的影响真的巨大。这一年认识了很可爱的 00,希望可以一直走下去。 我和 00 的孩子们: 卧龙:调皮的肥猫 🐱 小绿:喜欢咬东西的鳄鱼 🐊 骆雁:超级大的土鸡!🐰 凤雏:不调皮的猫咪 🐱 黄帝:更大的巨兔 🐰 内存条:白色的熊熊 🐻 闪光灯:灰色的熊熊 🐻 现在要做的事情 把 EmoRen 投了 能不能行啊 跑 CFD 的丹炉调好 好难呀 写完作业 NLP和DL的大作业! 搞定去ACL的手续 去加拿大,然后回挪威一两周,然后回来跟 00 去南京,我不用签证,但是还是有很多手续。 写好开题报告 还不知道做啥呢 我的家乡 Lillesand 好久没有回去了,上一次回挪威也没有回去

May 17, 2023 · 1 min · 陈英发 Yingfa Chen

第一篇

之前尝试用 Hugo 来部署,发现 Hugo 不仅挺复杂,而且还有很多小问题,可能这就是速度带来的代价吧。但是其实我也不是写很多内容,所以 Jekyll 的速度应该是够用的。 Jekyll 支持在 markdown 内容里面用 Liquid template tags 来生成动态内容,比如根据 front matter 中的 tags,给每个 tag 生成 html div。如下 liquid 语法: {% raw %} <div> {% for tag in site.tags %} <a style="background-color: blue;">#{{ tag[0] }}</a> {% endfor %} </div> {% endraw %} 会根据 post markdown 文件中的 front matter 中定义的 tags: --- tags: some tags here --- 生成相应的 html div: <div class="post-tags"> <a href="/tags/life" class="tag-card">life</a> <a href="/tags/update" class="tag-card">update</a> <a href="/tags/learn" class="tag-card">learn</a> <a href="/tags/important" class="tag-card">important</a> <a href="/tags/jekyll" class="tag-card">jekyll</a> <a href="/tags/hugo" class="tag-card">hugo</a> <a href="/tags/static-site-generator" class="tag-card">static-site-generator</a> </div> 不知道写啥,就写一个 Python 的二分搜索吧: ...