自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

本文主要是介绍自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

全文共2755字,预计学习时长7分钟

 

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

图源:unsplash

 

作为一个尚未完成计算机科学学位、只拥有数据科学证书的求职者,几周前,笔者接受了亚洲最大电信公司之一的数据科学实习面试,而下周就将开始工作。

 

我是如何这个获得面试机会的?在我看来,这完全是因为我的数据科学作品集以及展示的项目。

 

申请数据科学工作太不容易了,要想与你所申请的公司完美契合几乎是不可能的。笔者的建议是,与其尝试学习所有工具,不如使用已掌握的知识来创建实用的事物,这样你可以学到最多,之后还能向全世界展示你的项目,围绕它讲故事。

 

创建感兴趣的项目并不仅仅展示了你的技能,还显示出你对工作的热爱。

 

你将需要花费数周(有时乃至数月)时间来将一个想法付诸实践。盯着笔记本电脑几个小时,试图修复代码,每次试图运行它时都会向你抛出一个错误。

 

有时,你花了一个月的时间后才意识到项目根本无法完成;也许是数据集存在缺陷,你无法提高模型在实际用户数据上的准确性,一个月的辛苦工作付诸东流,不得不重新开始。

 

只有对工作真正热爱的人才能坚持下去,这将使雇主相信你可以胜任这份工作。即使没有完全符合职位描述,雇主也会相信你是一个能够解决当前任务的人。

 

本文将带你了解一些应该做的数据科学项目。这些项目不仅能提高你作为数据科学家的技能,而且能为你的简历增添光彩。

 

Kaggle

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

图源:unsplash

 

Kaggle项目是一个很好的起始点,其项目中的数据干净且结构化,分析结构良好的数据并对其运行机器学习模型是非常容易的。如果你是一个初学者,Kaggle是动手实践的最佳的地方!

 

做Kaggle项目的最大优势就是你可以在网上找到大量指导。每个人都在做,争相获得最高的准确度。人们写博客文章、制作GitHub存储库和YouTube视频,展示解决问题的方法。

 

Kaggle还提供了一些对初学者友好项目的教程,这些教程在起步时非常有帮助。Kaggle项目非常适合初学者的起步阶段。浪费在数据收集和清理上的时间越少,就可以将越多的时间花费在培养机器学习技能上。

 

但是,如果你的目标是创建令人印象深刻的数据科学作品集,请远离Kaggle。

 

为什么?现实世界的数据是混乱的。在公司工作时,你不会获得像Kaggle那样干净整洁的数据集。实际上,数据科学家约80%的工作都用在清理数据上,而仅有20%用于模型。

 

通过展示Kaggle项目,你只显示出了工作所需技能的一小部分——创建高度准确的模型(有时)。那么,进阶做法是怎样的?

 

展示各种技能

 

是的,现在潜在的雇主知道了你可以创建出色的监督学习模型,从而做出高度准确的预测。还有别的什么能展示吗?

 

确保创建展示各种技能的不同类型的项目——数据清理、分析、可视化、机器学习和交流。如果你拥有其他领域的专业知识,那么将这些知识融合到数据科学项目中会更容易脱颖而出。

 

展现热爱

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

图源:unsplash

 

你需要热爱所做的事。可能未必热爱编码、数学或机器学习,没关系,你需要做的是找到一种在热爱的领域中使用数据的方法。也许你喜欢音乐,你可以尝试创建一个音乐分析项目,通过分析趋势来预测下一个大热门。在Towards Data Science上就有一整页都是专门介绍音乐分析的。

 

如果创建与热爱事情相关的数据科学项目,即使遇到困难也更可能继续前进,相比于不感兴趣的项目这要容易得多。

 

举例

 

笔者一直对揭示社会问题感兴趣,如气候变化、性别不平等和种族差异等。有什么方法能比数据更深入地了解这些问题呢?这让笔者创建了数据分析项目,例如:

 

· 好莱坞性别差异分析(https://towardsdatascience.com/the-bechdel-test-analyzing-gender-disparity-in-hollywood-263cd4bcd9d)

· 黑人驾驶——数据分析(https://towardsdatascience.com/driving-while-black-what-does-the-data-say-e77cac9ab15b)

· 技术中的性别不平等分析(https://medium.com/better-programming/the-gender-gap-in-data-science-what-the-data-says-2a74892655f1)

 

另外,笔者喜欢阅读。小时候最喜欢《哈利·波特》系列,所以笔者创建了一个《哈利波特》人格预测模型。(https://towardsdatascience.com/a-full-stack-machine-learning-project-7ab80e46e1c4)

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

图源:unsplash

 

这只是一些例子,你可以试着将数据和热爱的领域结合起来,创建一个数据科学作品集。

 

交流

 

更重要的是,你要确保传达出你的项目。如果将代码放在GitHub存储库中而没有任何解释,那么仅仅是创建一个出色的产品是不够的。创建数据科学项目后,你要围绕它讲一个故事。

 

你为什么决定开始这个项目?完成它采取了哪些步骤?你有什么数据发现?用简单的术语来介绍你的项目,让所有努力读懂它的人都可以轻松理解。可以创建GitHub pages网站来解释你的项目,写给 Medium出版,甚至创建自己的博客。

 

数据科学作品集

 

最后,你需要将所有工作放在一起。建议创建一个数据科学作品集网站来展示所有内容。当笔者申请实习时,发送的只是作品集网站的链接。包括笔者GitHub和Medium帐户的链接,并对做的所有项目撰写了简短的摘要。

 

笔者只花了一天就完成了自己的网站。可以从这里了解如何创建简单的数据科学作品集网站:(https://towardsdatascience.com/how-to-create-a-data-science-portfolio-website-dcba6bf00994?source=---------8------------------)。

 

如果已参加了几门在线课程,并且不确定接下来要做什么,那么我建议你开始做数据科学项目。做一些研究,选择一个数据集,然后开始。给自己一个截止日期,努力在那之前完成。行动起来吧!

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

这篇关于自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/776999

相关文章

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核