达观数据创始人『陈运文』丨 在“智能文本”的世界里 创新创造永无止境

本文主要是介绍达观数据创始人『陈运文』丨 在“智能文本”的世界里 创新创造永无止境,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方 “Ai时速”  智慧赢未来



陈运文


写在前面





社会很浮躁,我们一定要静下心,专注做一件事情,咬定一个行业坚持做下去。



运文其人

纯粹、完美、无瑕的儒士,

复旦大学计算机博士、杰出毕业生,ACM KDD-Cup冠军,

先后履职百度、盛大创新院、腾讯文学,

15年创立[达观数据]至今,带领团队每年持续刷新成就:

  • 入选联想之星第九期学员;

  • 成为“微软加速器.上海”二期成员;

  • 获真格基领投的1000万天使轮投资

  • 获软硬赛富领投的5000万A轮融资

  • ……

「达观数据」 

“达观”通达乐观,为企业提供文本挖掘、知识图谱、个性化推荐、垂直搜索等人工智能服务。

目前为止,达观数据在算法方面已经申请了30项国家发明专利,先后获创青春中国互联网大赛、ACM KDD-Cup等国内外大赛并多次捧回奖杯。




1

被数据深深吸引:从数据科学到智能文本,为业务赋能

“在100毫秒内从几百亿条数据中挑选出优质结果,我被神奇的数据处理过程深深吸引了。”

在复旦读博期间,我十分喜欢研究机器学习算法,多次在国际期刊上发表研究成果。但是,比起在学校,工业界的大数据研究挑战更大,在100毫秒内从几百亿条数据中挑选出优质结果,我被神奇的数据处理过程深深吸引了临毕业时,选择了拥有海量数据的百度。

后来在盛大创新院,我幸运地遇到了一批计算机领域的牛人,如潘爱民、陆坚博士等,让我更加坚定了走大数据这条路。

创新院鼓励每一个人去创业,去实现自己的梦想,这也是最吸引我的地方:有想法你就去做,有项目你就去孵化。起初觉得“孵化”挺好,后来发现还是需要有场景落地,2012年转到盛大文学负责大数据研究,之后带着这样一群人,参加了国际数据挖掘竞赛KDD Cup。夜以继日的比赛,对算法的不懈追求,让志同道合的我们心靠得更近。



2

智能文本创新永无止境-达观数据

“相比常见的数字数据,文本数据的处理要让机器更能准确理解文字的含义,中文语法句法的复杂和多样也是处理的难点。”

2015年,大数据是一个时髦的概念,但我发现真正落地的大数据非常少,而对文本数据进行挖掘处理就更少了。相比常见的数字数据,文本数据的处理要让机器更能准确理解文字的含义,中文语法句法的复杂和多样也是处理的难点。

另一方面,个人生活的逐渐安逸让自己感到了迷惘,原本的工作也变得没有成就感。环顾四周,早些时候从盛大创新院走出来的朋友,在业内已经闯出了名气:七牛云存储的许式伟,UCloud的季昕华,云知声的黄伟等。早年深埋心底的创业想法又重新冒了出来。

7月,我坚定了创业的决心,我希望自己不断推进达观的算法演进,帮客户解决他们存在的问题,提升他们的经营业绩,将企业内部数据发挥出最大价值。

我们的团队技术氛围非常好,平时会聊聊最新的算法,谈谈那些美国公司、大学发表了哪些新的论文等。在每个季度会议上,大家都会讲讲取得哪些成绩,遇到过什么困难,解决了什么问题……我们还颁发“季度之星”给表现好的员工,大家都挺开心,有一种一家人的感觉。



3

致创业者

“最重要的是坚持!创业会遭遇无数挫折,需要破釜沉舟、背水一战的决心。”

1

  最重要的是坚持!

一万小时定律告诉我们,只要你反复琢磨一件事(或一个行业)一万小时,你就变成专家,你在职场里就很值钱。社会很浮躁,我们一定要静下心,专注做一件事情,咬定一个行业坚持做下去。


2

  创业就是破釜沉舟、背水一战

达观在启动时期,也曾遭遇无数挫折。其中,“人”是最困难的:好不容易找到合适的人,被放鸽子是常有的,甚至说好第二天入职,工作笔记本电脑也买好了,第二天却没来,打电话也关机,当时内心深处的悲凉到现在都让人唏嘘不已。





这是最好的时代,也是最坏的时代!

不容置疑的是,Ai无处不在!

关注「Ai时速」用速度和激情体验Ai时代,

2018丨我们「一起Ai」

 Ai时速 

因着Ai的美好未来:一起PK分享、进化成长!

圈子|机会|进化|创业

这篇关于达观数据创始人『陈运文』丨 在“智能文本”的世界里 创新创造永无止境的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/164678

相关文章

Java注解之超越Javadoc的元数据利器详解

《Java注解之超越Javadoc的元数据利器详解》本文将深入探讨Java注解的定义、类型、内置注解、自定义注解、保留策略、实际应用场景及最佳实践,无论是初学者还是资深开发者,都能通过本文了解如何利用... 目录什么是注解?注解的类型内置注编程解自定义注解注解的保留策略实际用例最佳实践总结在 Java 编程

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例

基于Python打造一个智能单词管理神器

《基于Python打造一个智能单词管理神器》这篇文章主要为大家详细介绍了如何使用Python打造一个智能单词管理神器,从查询到导出的一站式解决,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 项目概述:为什么需要这个工具2. 环境搭建与快速入门2.1 环境要求2.2 首次运行配置3. 核心功能使用指

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

SpringMVC 通过ajax 前后端数据交互的实现方法

《SpringMVC通过ajax前后端数据交互的实现方法》:本文主要介绍SpringMVC通过ajax前后端数据交互的实现方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价... 在前端的开发过程中,经常在html页面通过AJAX进行前后端数据的交互,SpringMVC的controll

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读

Spring 请求之传递 JSON 数据的操作方法

《Spring请求之传递JSON数据的操作方法》JSON就是一种数据格式,有自己的格式和语法,使用文本表示一个对象或数组的信息,因此JSON本质是字符串,主要负责在不同的语言中数据传递和交换,这... 目录jsON 概念JSON 语法JSON 的语法JSON 的两种结构JSON 字符串和 Java 对象互转