关于数据科学家面试的那些事儿

简介: 本文是关于数据科学家面试题的一些建议,希望能够给大家一些启发

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud


数据科学是技术领域中最不明确的领域之一,这篇文章可能会你下一次作为招聘人员或应聘者面试带来启发

招聘人员所要做的事

面试很困难,数据科学是如此。每个公司对数据科学都有不同的看法。 更糟糕的是,许多人在招聘过程中或之后才发现他们想要什么。

作为招聘人员的责任是尽可能清楚地说明工作描述:需要的是数据工程师,可视化专家,数据分析师,算法工程师还是机器学习研究员? 知道你想要什么,并及早过滤。

这个工作的不确定性将会遗漏最好的候选人——除非你是Google 等。他们会想知道已经建立了什么工具,他们的工作的投资回报率如何衡量,在团队中有谁……


本文涉及“机器学习”数据科学家。

让数据科学家谈论他们所知道的

数据科学家有非常不同的背景。每一次面试都不可能做好全部的准备:他们是否应该学习“标准”计算机科学?统计?关于贝叶斯定理的?深度学习?机器学习?你公司的领域?

优秀的求职者有许多类别的基础知识,善于动手实践,并在一些领域拥有丰富的知识。如果你想进行技术讨论的话,这有一些例子:

  • 问题类型:回归/分类/聚类/异常检测…
  • 数据类型:计算机视觉/时间序列/ NLP /推荐系统
  • 复杂数据:降维,流形学习
  • 观点:深度学习/贝叶斯机器学习/图形模型…
  • 专长:行业洞察/优化/数值方法…

我的观点是“开放”1-1面试比办公室笔试要好。许多公司给出关键数据集,并要求分析。它可以帮助看出谁是务实的!对于有经验的求职者可以提问很多,问关于他们的项目,或在Kaggle / GitHub上的表现。


具有行业经验的求职者应该有失败的项目。 这些教训是必不可少的。

数据科学面试专题

然而,许多话题在数据科学面试中似乎是可争论的对象。 记住,目的是促进讨论:很少有一个唯一正确的答案!

机器学习与模型工程

  • 你目前正在讨论的任务有哪些算法?
  • 它们什么时候完成,足够完善,完善的基准,等等。
  • 它们是如何工作的?是如何测量的?它们的参数拟合是如何优化的?
  • 你如何评价一个模型的性能?根据上下文,这可以导致关于假正/假负、准确性、召回、AUC、提升等的讨论。这应该如何决定?
  • 你如何选择最终的模型?性能?训练时间?评估速度?复杂性?
  • 了解交叉验证和偏差/方差是至关重要的。
  • 你如何做变量和模型选择? 你可以考虑信息化指标、正则化、稀疏性诱导方法,如L1正则化、向前/向后搜索...

数据工程

  • 你如何设计X
  • 你会对任务X做什么预处理?
  • 不平衡数据呢?丢失的数据?异常值?
  • 以及高基数的分类变量?
  • 如何处理大数据? 考虑在线学习、映射/化简、(小批量)随机梯度下降...
  • 你知道什么工具/语言可以实现X? 你使用哪些?为什么?
  • 你使用哪些可视化工具? 为什么?

作出决定?

这总是放手一搏的。你不可能仅在短短几小时内可靠地评估求职者过去项目中的参与情况,他们的专业知识,甚至你与他们的合作情况。

不要害怕选择具有不同背景和经验水平的求职者。 数据科学团队需要这样的人才。 如果你正在开始这样一个团队,就要依靠有专业知识的人:这是避免浪费时间的唯一办法。


2e522d281beec9421f6f59868c937919af68605d

作者:Arthur Flam ,企业家,数据科学家。三星的算法工程师。

Twitter: @ArthurFlam

博客:shapescience.xyz

Linkedin:linkedin.com/in/arthurflam


以上为译文

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Interview questions for data scientists,作者:Arthur Flam,译者:tiamo_zn,审校:李烽。

文章为简译,更为详细的内容,请查看原文

相关文章
|
3月前
|
机器学习/深度学习 算法 搜索推荐
数据分析师的职业规划与参考资料
数据分析师的职业规划与参考资料
|
机器学习/深度学习 分布式计算 算法
机器学习岗位面试总结:简历应该关注的5个重点
机器学习岗位面试总结:简历应该关注的5个重点
365 0
机器学习岗位面试总结:简历应该关注的5个重点
|
算法 Java 大数据
峰哥最近面试了几个候选人,总结一些经验和看法
峰哥最近面试了几个候选人,总结一些经验和看法
|
数据库
给软件工程师、数据科学家和数据工程师的面试指南:该做与不该做
7月9日 19:00-21:30 阿里云开发者社区首场“Offer 5000”直播开启!15位团队技术大牛在线招人,《阿里云技术面试红宝书》助你拿下Offer!马上投递简历:https://developer.aliyun.com/special/offerday01,在此,小编奉上数据库面试指南
1312 0
给软件工程师、数据科学家和数据工程师的面试指南:该做与不该做
|
机器学习/深度学习
初入数据科学领域,你需要有七个这样的思维
当数据科学家加入一家公司的时候,做事的思想往往是最重要的!
1737 0
|
机器学习/深度学习 算法 Python
求职简历-机器学习工程师
1.基本信息 求职岗位:机器学习工程师(偏应用) 期望薪资:20000以上 姓名:雷坤 手机号码:18150382334 邮箱:474933858@qq.
3057 0
|
机器学习/深度学习 分布式计算 Python
数据分析师的自我修养,如何进阶为数据科学家
本文讲述如何从数据分析师进阶为数据科学家。
1977 0
|
算法
每个数据科学家都应该学习4个必备技能
作为一个数据科学家你必须要掌握的四个必备技能,值得每个想要成为数据科学家和已经成为数据科学家的人去学习。
6559 0
|
机器学习/深度学习 TensorFlow 算法框架/工具

相关实验场景

更多