多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷 多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷
admin
2024-04-15 17:08:10
0



机器之心报道

机器之心编辑部

「尽管我在顶级 ML 会议上发表了多篇一作论文,为开源项目做出了贡献,也在业界产生了影响,但我仍在为进入博士课程而苦苦挣扎。我被顶尖大学拒之门外,感到迷茫和疲惫。」

「我开始怀疑自己,怀疑如果没有合适的人脉或家庭背景,光有强大的研究背景是否还不够。我正在考虑放弃攻读博士学位以及从事有价值研究的梦想。」

在刚刚过去的周末,关于「AI 博士申请条件卷上天」的帖子成为了 Reddit 社区讨论的焦点。



这个帖子的作者在 EMNLP、NeurIPS、ACM、ACL 等顶级会议和研讨会上以第一作者发表了多篇研究论文,也被公司评为过最佳 NLP 研究员。

但这些昔日荣誉,都无法抵消如今申请博士无果的挫败感。

评论区的网友以鼓励为主,主要观点如下:

Relax, take a deep breath, you are doing well!你申请的斯坦福大学和卡耐基梅隆大学,这些都是最优秀、最有竞争力的大学,没有被录取并不意味着有什么根本性的错误。可以试试申请更广泛的博士学位课程。即使没有顶级 ML 会议论文,也很有可能被录取。也许你的推荐信 / 目的陈述有点弱?

但真实现状不可忽视,Reddit 社区的另一篇帖子残酷地指出:申请 AI 博士,就是越来越难了。



作者自称「斯坦福计算机科学博士生」,以圈内人的身份发言:「很多人都不了解现在顶尖博士项目的招生竞争有多激烈......」

首先需要重新讨论的是:「你甚至不需要顶级会议论文就能进入顶级博士项目」,这是不正确的。



作者表示,如果有私人关系,或者有非常熟悉目标院系的人写的非常有力的信,那也没错。在大多数情况下,情况并非如此,因此你需要更多的论文来提升自己的形象。老实说,现在通常需要两者兼备(人脉 / 有力的信件加上论文 / 成就)。

让我们看看作者是怎么说的:

事实上,我并不感到惊讶。顶尖项目看重的不仅仅是论文,来自著名 / 受人尊敬的教授的极具说服力的推荐信以及与你希望共事的导师的个人联系更为重要。

顺便提一下,我那一届录取的大多数博士生都有 7 篇以上的顶会论文(有些还获得了最佳论文奖)、数百篇论文引用、大量研究论文、CMU 或 UW 等顶级学校的硕士学位或谷歌或 OpenAI 等顶级公司的实习经历、著名研究者的推荐信、人际关系、研究奖项、为顶级公司或在大型活动 / 会议上发表演讲等。这些顶尖博士项目正在从全世界范围内挑选最优秀的学生。

评论中的人根本不知道 NLP 的竞争有多激烈(我猜这是原作者的领域,因为他提到了 EMNLP)。请记住,这也是在 ChatGPT 热潮之前,所以现在的竞争可能更加激烈......

我不想吓唬 / 打击你,只是实话实说。每年的情况都在恶化(竞争呈指数级上升),我通常会鼓励那些刚刚进入 ML 研究(希望 / 目标是攻读博士学位)、没有现有经验和出版物的人三思而后行,或者考虑其他选择。

如果有人问「质量重于数量」的问题,我会说,数量可以帮助你通过早期录取阶段(因为申请者太多,所以他们必须使用「简单 / 可量化的指标」来筛选,比如论文数量,除非你有关系或知名研究人员的推荐信),但后期主要是质量和研究契合度,因为个别教师会审查学生的资料(甚至会深入阅读他们的一些论文),并进行一对一面试。因此,「量」是帮助你进入后期阶段的一个因素,但「质」(不仅仅是你的论文,还包括推荐信和你的实际经验 / 潜力)对最终录取决定的影响更大。

此外,结果还取决于领域。CS 作为一个整体是很有竞争力的,但 ML/AI 则是另一个层次。而在 ML/AI 中,像 NLP 和视觉这样的领域更是竞争激烈。子领域不同,情况也不同。例如,NLP 和视觉等领域的竞争非常激烈,但机器学习理论的竞争相对较小。

这还取决于你的目标学校、实验室 / 教授、研究契合度、人脉等。不能一刀切。但我想说的是,尽管会有例外情况,但总体而言,现在的竞争非常激烈。

我并不是要打击大家的积极性,而是希望大家能够坦诚、透明地表达自己的想法,这样大家就会知道自己的期望是什么,也就不会因为结果而一蹶不振,同时也能更理智地申请(例如,申请更多的学校 / 实验室,包括排名较低的学校 / 实验室,以及行业职位)。在这个竞争如此激烈的时代,最好能有更多的选择......

在我看来,顶级 ML 博士录取的最重要因素是:

与教授的联系和研究契合度推荐信(最好来自顶级研究人员或目标导师熟悉的人)出版物(质量)出版物(数量)总体研究经历和成就SOP(只要整体研究契合度、推荐信和个人简介都很强,这一点就不那么重要了,只要不是写得太差就行)GPA(只要不错,并能达到通常宽松的分数线,就没问题)GRE / 其他考试成绩(通常也以分数线为基础,似乎现在的大多数博士项目不再要求 GRE / 其他考试成绩)。

这让我们想起了前两天的一个新闻:顶会 NeurlPS 开设了高中生论文 Track。AI 领域经验的积累,似乎已经要从娃娃抓起了,或许这个领域会越来越卷。

不只是上文作者所在的斯坦福,据说其他排名靠前的大学的录取水准也高得吓人:



几年前,情况还不是这样的。这让一部分研究者庆幸:幸亏自己入学早。



不过,话说回来,申请博士当然不是唯一有意义的选择。

就像这个帖子的热评第一所说:

我只是希望他们意识到你不需要去这些机构之一。你不需要它来做出好研究,你不需要它成为一个行业 RS,你不需要它来赚很多钱,等等。这些事情,既不是必要的也不是充分的。

https://www.reddit.com/r/MachineLearning/comments/1c2x5mx/d_folks_here_have_no_idea_how_competitive_top_phd/

https://www.reddit.com/r/MachineLearning/comments/1c2pnam/d_multiple_firstauthor_papers_in_top_ml/a

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...