首先,题主的background有些特殊:22年硕士结业后gap了一年,申请23fall日本cs/ee/ece的PhD。23年年初2、3月份的时侯算是尘埃落定,领到几个CS/ECE的全奖offer。想着离8月开学还有近6个月,闲着也是闲着,就怀着试一试的态度去投23年暑周末间的实习。题主的background如下:
(a)Internship:推荐算法实习生。由于题主硕士期间的主要研究方向就是推荐模型算法与社会化学学(linkprediction)做学科交叉,也涉猎了不少ML。很想有一段相关的工业界经历~(b)Base:只投了上海。想去上海玩一玩,就当补偿一下去年的结业旅行~(c)专业:专科信管(学了不少CS课程,包括数据结构与算法、操作系统、计算机网路、数据库、系统构架设计、C、信安基础等等;硕士理论化学(主要学了一些物理课);博士CS偏ML(当初8月份才入学,所以目前不能严格算在校生)。(d)个人硬件:没有时间刷leetcode、没有时间背八股文、之前也没有intern经历,只有2篇RS相关的SCI(JCR2区)的paper。纯属PhD申请完后紧接着想去试试(好在最后没去世)...(e)途径:Boss直聘、实习僧、少数内推。投了差不多100+,回复率30%左右,给笔试的有6家(接了offer后就没再笔试和投)
A厂(著名研究院,研究型实习生,做蛋白质结构预测)
是个研究院,position的研究方向是蛋白质结构预测,和我的研究经历不太match,惟一的交集可能就只是GNN了
Round1(2023.2.14,团队小boss技术面)过去的研究经历?为何有独立作者的paper?偏向于自己独立举办工作?simplex的定义是哪些?你晓得SO3、李代数这种吗?刚才听你说从群论来理解和研究网路的高阶结构。怎么拆解怎么计划怎样落实?目前准备进行研究的具体点?算法题:将两个数组合并。时间复杂度?数组和字段的不同?告诉我她们主要做蛋白质结构预测的快手热门算法,由于是健康估算中心。Round2(2023.2.21,部门负责人非技术面)担心5个月的时间里假如独立举办工作,而不一定能产出去美团之类的大厂可能更match吧?做推荐的话他说他对可解释性不发烧他说他对GNN不看好问我一定是非要发论文?给你任务你来完成能否?不独立举办,而是参与?
Anyway,二面给我的觉得是纯属劝退...
Round3(2023.2.28,hrbp面)描述一下你自己,还有你的研究工作。你在人生中遇见过的挑战?以及怎样克服的?团队合作经历?为何要读博士而不是直接考虑就业?为何要去英国读博士?你目前领到了什么中学的offer?最后说她们希望招进来的实习生才能与她们构建起connection,作为人才储备等等的(这儿我就觉得凉了...我不是严格意义上的在校生,并且8月开学就飞去日本了==)
还有几个问题记不得了。之后最后被pass掉了呜呜~然后最先的这位hr说可以把我的CVtransfer给研究院的其他团队重新笔试假如有机会的话。
B厂(大厂、NLP+搜索)Round1(2023.2.22,技术面应当是个团队小Boss)聊聊你过去两篇论文分别做了啥?你的第二篇文章实际上是只适宜小数据的一种zero-shotlearning?你对搜索的理解?例如用户输入一个query,你如何给用户返回他想要的信息?(这个问题没回答好,虽然之前不是做搜索的。不过还是有收获的,颠覆了我对百度搜索引擎前端模型算法的认知。具体而言,他说:假如用关键词匹配的话这么将会非常复杂,由于文本内容一大串,例如搜一道题,关键词将非常多。百度搜索返回的关键词只是一种解释性的东西返回给用户。实际上我们内部的估算系统不是用的关键词。)为何会出现梯度爆燃或梯度消失?你对激活函数了解吗?例如ReLu,为何会出现神经元失效的情况?过拟合和欠拟合是哪些?为何会发生它们?算法题:给你两个词组word1和word2,请返回将word1转换成word2所使用的最少操作数你可以对一个词组进行如下三种操作:(1)插入一个字符;(2)删掉一个字符;(3)替换一个字符
最后G了,一面后就没给通知。最后一个算法题思路不对,他说用动态规划做。没刷leetcode的劣势彰显下来了呜呜~
C厂(国企大厂,数据剖析)Round1(2023.3.1)
一个实习生面的。反馈说岗位不太match,被劝退。。。
建议你在简历中的项目经历中加一些描述你会spark吗?SQL虽然我们没怎样用你看还有其他更适宜的岗位吗,我可以内推的时侯把你转过去笔试流程有算法题不晓得你能Hold住不(没刷leetcode真的倍感机会无望...)你会什么编程语言?你有去投上海西城的公司吗?像快手、字节它们做推荐就非常NB(好吧...我投了,但字节我的简历都没过-0-)简历很优秀,但岗位太不匹配了,希望不大
G+1
D厂(大厂,算法实习生,推荐产品中心)Round1(2023.3.2,业务初面,应当是个团队小leader,多半是来找我刷KPI的==)
开始自我介绍时就跟他说不要考我算法题,我没时间刷leetcode。。。之后这一场算是面得最轻松觉得最好的,并且...
简单介绍一下你自己。你的那篇determinableandinterpretable...的论文是做哪些的?可解释性是哪些意思?怎样使推荐模型具有可解释性?举个反例?你对近来机器学习推荐模型有过了解吗?你的recommendersystemsbasedongraphembedding...这篇文章是做哪些的?为何说是伪人工智能?它和真正的智能有哪些区别呢?你认为怎么让伪人工智能更具有真正的智能?我看你专科是信息管理与信息系统,为何硕士去读物理学了?为何博士不去申请认知神经科学而是申请计算机?你认为ChatGPT是真正的人工智能吗?你了解k-means降维算法吗?写一下它的代码。为何实习想着来做推荐算法?
给我的觉得就是有点敷衍的一场面试,像是刷KPI的,全程姊姊笑。。。似乎一面的问题都答上了,他也说对,但一面后也就没后续了。。。
E厂(大厂,推荐部,主要做文库、贴吧、词条等方面的推荐任务,也会涉及到一些NLP)Round1(2023.3.3)
同样,自我介绍的时侯跟他说,尽管大专期间出席过算法编程大赛,例如蓝桥杯、icpc,得过奖,但硕士五年都没接触,同时之前刚申完PhD没时间刷leetcode,求求他别考我算法题(尽管并且最后还是考了,G!)...
简单介绍一下你自己。算法题:有一个循环数组,怎么读取它的这么被步入循环的节点?(想了两个方式,可以如此做,但不是标准答案,时空复杂度显著高,代码复杂度显著高。正确答案应当是用双表针,两步快慢表针啥的?总之没答到这个点子上。还是一道简单题)决策树、逻辑回归、bootstrap算法介绍一下?决策树的目标函数有什么?GNN分什么技术?
不仅那道算法题戳中了知识盲点,其他都答上了,但一面后也没后续了。
F厂(内资中厂,出海电商快手热门算法,推荐策略算法,主打留中学生实习)Round1(2023.3.3,主要是推荐系统相关的业务理解)
我后来的直属leader面的~
简单介绍一下自己。(同样,趁这个机会求求别考我算法题。leader最终没考,但也给我解释了一下互联网大厂的笔试为何喜欢考算法题)图嵌入推荐算法是哪些?(装作一副不懂的样子来问我。恐怕他比我懂得多)优化目标函数中有一些terms,分别表示诸如用户点击率、购买率、停留时长等。你觉得这种terms应当以如何的方法来组成这个函数?(例如它们是相乘还是相加?)怎样提高用户推荐物品的多样性?重排的一些技巧有什么?假定有一款APP,你觉得我们在用户他的主页上推荐的物品和另外一个everything下的物品应当分别是如何的策略?给用户推荐一些刚下来的item,反倒用户对APP的使用率等增加了,为何呢?你认为有必要牺牲一些用户使用率来让一些爆光度没这么高的物品推荐给用户吗?你可以实习到多久?实习地点希望在那里?(北京和天津。主要是在上海)Round2(2023.3.6,业务面,我们部门的leader面的)怎样看待给用户推荐重复的物品?现今好多推荐系统都是双目标,例如ctr和cvr,你是怎样看待的,该如何办?Round3(2023.3.10,部门leader的leader)两个广西同乡攀谈问暖~申请上了德国哪所学院?那个program?未来的研究方向是啥呢?我看你研究生学的是化学专业,那和推荐算法有哪些联系呢?简历上是科研经历,那挑一个谈谈吧?你有近来写的代码的sample吗?发一个我瞧瞧。给我一下这个github的地址。你的那种AIProbS是啥?就是你的科研论文的吧?你是怎样了解我们公司的?为何想来申请我们这个岗位?
offer到手~本期实习申请结束!
最后是我在借助每场面试的最后提问机会get到的笔试官和公司通常对实习生的能力期望和基本要求:
D厂:能力需求一方面是research的能力,由于我们部门也有做研究。另一方面是coding的能力,即使是做研究,但还是须要写代码的。主要用python。
E厂:coding能力,由于做research也要写代码。精典的机器学习模型算法要有一定了解。
F厂:(a)符合岗位描述。通常来说通过笔试就基本上OK啦。(b)自驱力很强。不局限于仅仅完成交待的工作,并且还有思索、可优化。对于我的情况而言,落地先另说,即使不一定期望我一定就能发paper,但部门上面也有专门搞模型和算法的朋友可以供一起交流。(c)coding能力似乎不太care。只要把握基本的数据结构和算法,例如才能用O(N)复杂度实现的算法就不要写成O(N2)等等。不犯这些低级简单的错误即可。也不一定说非得会JAVA啥的,编程语言仅仅只是一种语言,1-2个月才能上手啦。(d)才能很快且较好地把握在推荐系统这块的业务框架和流程等。(e)才能从实习岗位小学习到东西。(f)同时还能相对较独立地承当一些工作,虽然相辅相成嘛。
PS:而且F厂(也就是我如今正在实习的这家)对工程侧这边的实习生的coding能力要求是更高的。leader近来在群里说要加强coding在笔试中的占比,由于有太多闭门造车的,写出精典爬坡的工程代码。。。