自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

本文主要是介绍自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

全文共2755字,预计学习时长7分钟

 

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

图源:unsplash

 

作为一个尚未完成计算机科学学位、只拥有数据科学证书的求职者,几周前,笔者接受了亚洲最大电信公司之一的数据科学实习面试,而下周就将开始工作。

 

我是如何这个获得面试机会的?在我看来,这完全是因为我的数据科学作品集以及展示的项目。

 

申请数据科学工作太不容易了,要想与你所申请的公司完美契合几乎是不可能的。笔者的建议是,与其尝试学习所有工具,不如使用已掌握的知识来创建实用的事物,这样你可以学到最多,之后还能向全世界展示你的项目,围绕它讲故事。

 

创建感兴趣的项目并不仅仅展示了你的技能,还显示出你对工作的热爱。

 

你将需要花费数周(有时乃至数月)时间来将一个想法付诸实践。盯着笔记本电脑几个小时,试图修复代码,每次试图运行它时都会向你抛出一个错误。

 

有时,你花了一个月的时间后才意识到项目根本无法完成;也许是数据集存在缺陷,你无法提高模型在实际用户数据上的准确性,一个月的辛苦工作付诸东流,不得不重新开始。

 

只有对工作真正热爱的人才能坚持下去,这将使雇主相信你可以胜任这份工作。即使没有完全符合职位描述,雇主也会相信你是一个能够解决当前任务的人。

 

本文将带你了解一些应该做的数据科学项目。这些项目不仅能提高你作为数据科学家的技能,而且能为你的简历增添光彩。

 

Kaggle

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

图源:unsplash

 

Kaggle项目是一个很好的起始点,其项目中的数据干净且结构化,分析结构良好的数据并对其运行机器学习模型是非常容易的。如果你是一个初学者,Kaggle是动手实践的最佳的地方!

 

做Kaggle项目的最大优势就是你可以在网上找到大量指导。每个人都在做,争相获得最高的准确度。人们写博客文章、制作GitHub存储库和YouTube视频,展示解决问题的方法。

 

Kaggle还提供了一些对初学者友好项目的教程,这些教程在起步时非常有帮助。Kaggle项目非常适合初学者的起步阶段。浪费在数据收集和清理上的时间越少,就可以将越多的时间花费在培养机器学习技能上。

 

但是,如果你的目标是创建令人印象深刻的数据科学作品集,请远离Kaggle。

 

为什么?现实世界的数据是混乱的。在公司工作时,你不会获得像Kaggle那样干净整洁的数据集。实际上,数据科学家约80%的工作都用在清理数据上,而仅有20%用于模型。

 

通过展示Kaggle项目,你只显示出了工作所需技能的一小部分——创建高度准确的模型(有时)。那么,进阶做法是怎样的?

 

展示各种技能

 

是的,现在潜在的雇主知道了你可以创建出色的监督学习模型,从而做出高度准确的预测。还有别的什么能展示吗?

 

确保创建展示各种技能的不同类型的项目——数据清理、分析、可视化、机器学习和交流。如果你拥有其他领域的专业知识,那么将这些知识融合到数据科学项目中会更容易脱颖而出。

 

展现热爱

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

图源:unsplash

 

你需要热爱所做的事。可能未必热爱编码、数学或机器学习,没关系,你需要做的是找到一种在热爱的领域中使用数据的方法。也许你喜欢音乐,你可以尝试创建一个音乐分析项目,通过分析趋势来预测下一个大热门。在Towards Data Science上就有一整页都是专门介绍音乐分析的。

 

如果创建与热爱事情相关的数据科学项目,即使遇到困难也更可能继续前进,相比于不感兴趣的项目这要容易得多。

 

举例

 

笔者一直对揭示社会问题感兴趣,如气候变化、性别不平等和种族差异等。有什么方法能比数据更深入地了解这些问题呢?这让笔者创建了数据分析项目,例如:

 

· 好莱坞性别差异分析(https://towardsdatascience.com/the-bechdel-test-analyzing-gender-disparity-in-hollywood-263cd4bcd9d)

· 黑人驾驶——数据分析(https://towardsdatascience.com/driving-while-black-what-does-the-data-say-e77cac9ab15b)

· 技术中的性别不平等分析(https://medium.com/better-programming/the-gender-gap-in-data-science-what-the-data-says-2a74892655f1)

 

另外,笔者喜欢阅读。小时候最喜欢《哈利·波特》系列,所以笔者创建了一个《哈利波特》人格预测模型。(https://towardsdatascience.com/a-full-stack-machine-learning-project-7ab80e46e1c4)

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

图源:unsplash

 

这只是一些例子,你可以试着将数据和热爱的领域结合起来,创建一个数据科学作品集。

 

交流

 

更重要的是,你要确保传达出你的项目。如果将代码放在GitHub存储库中而没有任何解释,那么仅仅是创建一个出色的产品是不够的。创建数据科学项目后,你要围绕它讲一个故事。

 

你为什么决定开始这个项目?完成它采取了哪些步骤?你有什么数据发现?用简单的术语来介绍你的项目,让所有努力读懂它的人都可以轻松理解。可以创建GitHub pages网站来解释你的项目,写给 Medium出版,甚至创建自己的博客。

 

数据科学作品集

 

最后,你需要将所有工作放在一起。建议创建一个数据科学作品集网站来展示所有内容。当笔者申请实习时,发送的只是作品集网站的链接。包括笔者GitHub和Medium帐户的链接,并对做的所有项目撰写了简短的摘要。

 

笔者只花了一天就完成了自己的网站。可以从这里了解如何创建简单的数据科学作品集网站:(https://towardsdatascience.com/how-to-create-a-data-science-portfolio-website-dcba6bf00994?source=---------8------------------)。

 

如果已参加了几门在线课程,并且不确定接下来要做什么,那么我建议你开始做数据科学项目。做一些研究,选择一个数据集,然后开始。给自己一个截止日期,努力在那之前完成。行动起来吧!

自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

这篇关于自学四个月,我如何获得亚洲最大电信公司的数据科学实习机会?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/776999

相关文章

C#代码实现解析WTGPS和BD数据

《C#代码实现解析WTGPS和BD数据》在现代的导航与定位应用中,准确解析GPS和北斗(BD)等卫星定位数据至关重要,本文将使用C#语言实现解析WTGPS和BD数据,需要的可以了解下... 目录一、代码结构概览1. 核心解析方法2. 位置信息解析3. 经纬度转换方法4. 日期和时间戳解析5. 辅助方法二、L

使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)

《使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)》字体设计和矢量图形处理是编程中一个有趣且实用的领域,通过Python的matplotlib库,我们可以轻松将字体轮廓... 目录背景知识字体轮廓的表示实现步骤1. 安装依赖库2. 准备数据3. 解析路径指令4. 绘制图形关键

解决mysql插入数据锁等待超时报错:Lock wait timeout exceeded;try restarting transaction

《解决mysql插入数据锁等待超时报错:Lockwaittimeoutexceeded;tryrestartingtransaction》:本文主要介绍解决mysql插入数据锁等待超时报... 目录报错信息解决办法1、数据库中执行如下sql2、再到 INNODB_TRX 事务表中查看总结报错信息Lock

使用C#删除Excel表格中的重复行数据的代码详解

《使用C#删除Excel表格中的重复行数据的代码详解》重复行是指在Excel表格中完全相同的多行数据,删除这些重复行至关重要,因为它们不仅会干扰数据分析,还可能导致错误的决策和结论,所以本文给大家介绍... 目录简介使用工具C# 删除Excel工作表中的重复行语法工作原理实现代码C# 删除指定Excel单元

Linux lvm实例之如何创建一个专用于MySQL数据存储的LVM卷组

《Linuxlvm实例之如何创建一个专用于MySQL数据存储的LVM卷组》:本文主要介绍使用Linux创建一个专用于MySQL数据存储的LVM卷组的实例,具有很好的参考价值,希望对大家有所帮助,... 目录在Centos 7上创建卷China编程组并配置mysql数据目录1. 检查现有磁盘2. 创建物理卷3. 创

Nacos日志与Raft的数据清理指南

《Nacos日志与Raft的数据清理指南》随着运行时间的增长,Nacos的日志文件(logs/)和Raft持久化数据(data/protocol/raft/)可能会占用大量磁盘空间,影响系统稳定性,本... 目录引言1. Nacos 日志文件(logs/ 目录)清理1.1 日志文件的作用1.2 是否可以删除

使用Python获取JS加载的数据的多种实现方法

《使用Python获取JS加载的数据的多种实现方法》在当今的互联网时代,网页数据的动态加载已经成为一种常见的技术手段,许多现代网站通过JavaScript(JS)动态加载内容,这使得传统的静态网页爬取... 目录引言一、动态 网页与js加载数据的原理二、python爬取JS加载数据的方法(一)分析网络请求1

golang float和科学计数法转字符串的实现方式

《golangfloat和科学计数法转字符串的实现方式》:本文主要介绍golangfloat和科学计数法转字符串的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望... 目录golang float和科学计数法转字符串需要对float转字符串做处理总结golang float

8种快速易用的Python Matplotlib数据可视化方法汇总(附源码)

《8种快速易用的PythonMatplotlib数据可视化方法汇总(附源码)》你是否曾经面对一堆复杂的数据,却不知道如何让它们变得直观易懂?别慌,Python的Matplotlib库是你数据可视化的... 目录引言1. 折线图(Line Plot)——趋势分析2. 柱状图(Bar Chart)——对比分析3

Spring Boot 整合 Redis 实现数据缓存案例详解

《SpringBoot整合Redis实现数据缓存案例详解》Springboot缓存,默认使用的是ConcurrentMap的方式来实现的,然而我们在项目中并不会这么使用,本文介绍SpringB... 目录1.添加 Maven 依赖2.配置Redis属性3.创建 redisCacheManager4.使用Sp