DTCC专访：阿里巴巴“算法研发最集中部门”专家眼中的大数据

本文主要是介绍DTCC专访：阿里巴巴“算法研发最集中部门”专家眼中的大数据，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

点击上方“蓝字”可以关注我们哦

李永亮（花名悾傅）是阿里巴巴高级算法专家，他所在的部门搜索事业部算法技术部门是阿里巴巴集团算法最集中的部门，李永亮每天的工作与算法、推荐算法、nlp、视频、语音、图像打交道最多，不仅有如天猫搜索渠道的整体排序机制的设计和规划以及落地，这样与业务紧密关联的工作；还有如搜索事业部数据管理优化和底层特征的构建这样的中长期项目。

○

阿里巴巴高级算法专家

李永亮（花名悾傅）

作为一名在Cgogo、华为等知名企业有履新经历的技术大牛，他所擅长的算法研究正迎来发展的黄金期，因为人工智能、机器学习正在各行各业快速布局。李永亮指出，“在电商搜索中，阿里巴巴一直在探索AI机器学习领域在大数据、搜索端的应用，如DNN（深度神经网络）、DRL（深度增强学习）、LSTM神经网络等在电商场景的应用。”

从去年AlphaGo击败李世石，到以“Master”的身份创下连胜60局的记录，将人工智能推向高潮；而这与其背后的机器学习模型和算法等息息相关，而模型的创建离不开大数据支撑。而数据的质量会对此产生影响。

李永亮认为目前我们对大数据和大数据分析的利用还远远不够，“如英国脱欧、美国大选的数据分析来说就是一个统计分析，这种案例受太多商业、政治、利益因素的影响，统计只给出了一个历史的概率，而没有预测的判断能力。”

他指出数据质量离不开技术平台对数据的采集和深入挖掘，“阿里巴巴拥有统一的数据存储、计算、实时计算平台，还有数据管理、监控、特征平台来进行统一的整合优化、管理、监控等。”

同时，要让大数据更好的服务业务发展，实现商业价值发现，李永亮强调，“我们团队通过构建底层的统一数据和特征池及服务来标准化数据流，从而更好的服务算法工程师。”

Garter预测，到2018年大多数业务人员和分析师都将通过自助式BI工具来准备和分析大数据。对此，李永亮深表赞同，“其实有很多自助式的数据分析工具，估计半年内大部分人都应该具备相应的能力，就像现在很多人都要用Excel一样，否则就跟不上数据化的变化。”

对于大数据从业者，李永亮的建议是从业人员自身补充理论基础，同时利用好封装的工具包，以及商业智能的SaaS服务。

同时一支紧凑的大数据团队会能够为企业的数据应用和实现商业洞察打下坚实的基础，李永亮认为“一支高效紧凑的大数据团队大概在10人左右，结构比例为老中青3:4:3的比例，其中熟练占4成；岗位职责上数据管理ower为1-2人，算法工程师和数据分析师就业务情况来定，组团时间在一年左右完成，如果在北京、上海集中时间会提前。”