自学四个月，我如何获得亚洲最大电信公司的数据科学实习机会？

本文主要是介绍自学四个月，我如何获得亚洲最大电信公司的数据科学实习机会？，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

全文共2755字，预计学习时长7分钟

自学四个月，我如何获得亚洲最大电信公司的数据科学实习机会？

图源：unsplash

作为一个尚未完成计算机科学学位、只拥有数据科学证书的求职者，几周前，笔者接受了亚洲最大电信公司之一的数据科学实习面试，而下周就将开始工作。

我是如何这个获得面试机会的？在我看来，这完全是因为我的数据科学作品集以及展示的项目。

申请数据科学工作太不容易了，要想与你所申请的公司完美契合几乎是不可能的。笔者的建议是，与其尝试学习所有工具，不如使用已掌握的知识来创建实用的事物，这样你可以学到最多，之后还能向全世界展示你的项目，围绕它讲故事。

创建感兴趣的项目并不仅仅展示了你的技能，还显示出你对工作的热爱。

你将需要花费数周（有时乃至数月）时间来将一个想法付诸实践。盯着笔记本电脑几个小时，试图修复代码，每次试图运行它时都会向你抛出一个错误。

有时，你花了一个月的时间后才意识到项目根本无法完成；也许是数据集存在缺陷，你无法提高模型在实际用户数据上的准确性，一个月的辛苦工作付诸东流，不得不重新开始。

只有对工作真正热爱的人才能坚持下去，这将使雇主相信你可以胜任这份工作。即使没有完全符合职位描述，雇主也会相信你是一个能够解决当前任务的人。

本文将带你了解一些应该做的数据科学项目。这些项目不仅能提高你作为数据科学家的技能，而且能为你的简历增添光彩。

Kaggle

自学四个月，我如何获得亚洲最大电信公司的数据科学实习机会？

图源：unsplash

Kaggle项目是一个很好的起始点，其项目中的数据干净且结构化，分析结构良好的数据并对其运行机器学习模型是非常容易的。如果你是一个初学者，Kaggle是动手实践的最佳的地方！

做Kaggle项目的最大优势就是你可以在网上找到大量指导。每个人都在做，争相获得最高的准确度。人们写博客文章、制作GitHub存储库和YouTube视频，展示解决问题的方法。

Kaggle还提供了一些对初学者友好项目的教程，这些教程在起步时非常有帮助。Kaggle项目非常适合初学者的起步阶段。浪费在数据收集和清理上的时间越少，就可以将越多的时间花费在培养机器学习技能上。

但是，如果你的目标是创建令人印象深刻的数据科学作品集，请远离Kaggle。

为什么？现实世界的数据是混乱的。在公司工作时，你不会获得像Kaggle那样干净整洁的数据集。实际上，数据科学家约80%的工作都用在清理数据上，而仅有20%用于模型。

通过展示Kaggle项目，你只显示出了工作所需技能的一小部分——创建高度准确的模型（有时）。那么，进阶做法是怎样的？

展示各种技能

是的，现在潜在的雇主知道了你可以创建出色的监督学习模型，从而做出高度准确的预测。还有别的什么能展示吗？

确保创建展示各种技能的不同类型的项目——数据清理、分析、可视化、机器学习和交流。如果你拥有其他领域的专业知识，那么将这些知识融合到数据科学项目中会更容易脱颖而出。

展现热爱

自学四个月，我如何获得亚洲最大电信公司的数据科学实习机会？

图源：unsplash

你需要热爱所做的事。可能未必热爱编码、数学或机器学习，没关系，你需要做的是找到一种在热爱的领域中使用数据的方法。也许你喜欢音乐，你可以尝试创建一个音乐分析项目，通过分析趋势来预测下一个大热门。在Towards Data Science上就有一整页都是专门介绍音乐分析的。

如果创建与热爱事情相关的数据科学项目，即使遇到困难也更可能继续前进，相比于不感兴趣的项目这要容易得多。

举例

笔者一直对揭示社会问题感兴趣，如气候变化、性别不平等和种族差异等。有什么方法能比数据更深入地了解这些问题呢？这让笔者创建了数据分析项目，例如：

· 好莱坞性别差异分析（https://towardsdatascience.com/the-bechdel-test-analyzing-gender-disparity-in-hollywood-263cd4bcd9d）

· 黑人驾驶——数据分析（https://towardsdatascience.com/driving-while-black-what-does-the-data-say-e77cac9ab15b）

· 技术中的性别不平等分析（https://medium.com/better-programming/the-gender-gap-in-data-science-what-the-data-says-2a74892655f1）

另外，笔者喜欢阅读。小时候最喜欢《哈利·波特》系列，所以笔者创建了一个《哈利波特》人格预测模型。（https://towardsdatascience.com/a-full-stack-machine-learning-project-7ab80e46e1c4）

自学四个月，我如何获得亚洲最大电信公司的数据科学实习机会？

图源：unsplash

这只是一些例子，你可以试着将数据和热爱的领域结合起来，创建一个数据科学作品集。

交流

更重要的是，你要确保传达出你的项目。如果将代码放在GitHub存储库中而没有任何解释，那么仅仅是创建一个出色的产品是不够的。创建数据科学项目后，你要围绕它讲一个故事。

你为什么决定开始这个项目？完成它采取了哪些步骤？你有什么数据发现？用简单的术语来介绍你的项目，让所有努力读懂它的人都可以轻松理解。可以创建GitHub pages网站来解释你的项目，写给 Medium出版，甚至创建自己的博客。

数据科学作品集

最后，你需要将所有工作放在一起。建议创建一个数据科学作品集网站来展示所有内容。当笔者申请实习时，发送的只是作品集网站的链接。包括笔者GitHub和Medium帐户的链接，并对做的所有项目撰写了简短的摘要。

笔者只花了一天就完成了自己的网站。可以从这里了解如何创建简单的数据科学作品集网站：（https://towardsdatascience.com/how-to-create-a-data-science-portfolio-website-dcba6bf00994?source=---------8------------------）。

如果已参加了几门在线课程，并且不确定接下来要做什么，那么我建议你开始做数据科学项目。做一些研究，选择一个数据集，然后开始。给自己一个截止日期，努力在那之前完成。行动起来吧！

自学四个月，我如何获得亚洲最大电信公司的数据科学实习机会？