当前位置:首页 » 今日头条自媒体 » 正文

达观数据:做好计算机的语文老师教会机器能够理解

23125 人参与  2018年02月09日 17:08  分类 : 今日头条自媒体  评论

“文本挖掘”、“搜索推荐技术”、“知识图谱”这些词汇乍一听还真让人有些摸不着头脑。

“其实,我们就像是计算机的语文老师,教会机器能够理解人类的文字以及其所代表的含义,从而帮助我们更高效地完成一系列文字工作。”达观数据创始人陈运文的解释让人“秒懂”。

数据赋能的黄金时代

1.jpg

大数据的飞速发展显然是我们始料未及的。

在过去的十年里,我们所创造的数据量,已超过人类历史的数据总量。

每天,我们打电话、发信息、搜索、旅行、购物,做任何事情都在创造新的数据,数据将成为我们世界里最强大的一种力量。

而这种力量不仅来自于巨大的数据量,更重要的在于大数据背后的价值,也就是给数据赋能的过程。这就需要各个专业领域的数据服务公司对大数据进行挖掘和利用。

达观数据便是这样一家专注于文本智能处理领域的人工智能企业。

“我们的计算机运营能力远远超过10年前,与此同时我们的数据存储成本也大大的降低。” 陈运文回想起5年前在学校的实验室里百万的数据量已经到了极限,而如今,至少是以亿为单位的体量才能称得上大数据。这对于数据应用产业发展无疑是非常有利的。

“这是数据赋能的黄金时代”,陈运文很庆幸达观数据在这样一个时代创建并快速发展。

大数据进阶:从数据化走向智能化

足够多的数据推动了行业的快速发展。

“其实这个世界已经不缺数据,缺的是对数据精加工的能力,原始的数据如果不做处理,价值很小。” 陈运文表示。

陈运文解释,“用一句常说的中国老话来形容:熟读唐诗三百首,不会作诗也会吟。”如果让计算机阅读成千上万篇文章,它也可以从中总结规律。计算机拥有强大的运算和存储能力,可以比人做得更好。而达观要做的就是训练计算机拥有这样的能力,就像AlphaGo在学习了30万盘棋谱后,就能打败人类。

在大数据的初级阶段,我们更重视的是数据的采集,一个很好的趋势,也将在很大程度上促进智能化的发展。但我们仍然需要面对缺乏有质量数据的现实,很多行业的数据信息还停留在纸面上,没有数字化或者说文档没有做到很好的标注,无法让计算机进行高效处理。

随着数据采集技术的普及,数据不再稀缺。数据挖掘和数据应用的未来发展前景广阔、市场巨大,包括房地产、汽车、零售、法律等在内的各行各业都有引入智能化数据处理的需求。

大数据时代也将从数据化逐步进阶,走向智能化。

帮到每一个和文字打交道的人

中国有很多大中型企业,拥有大量的数据、资料和内容性信息,但缺乏数据处理能力让很多有意义的数据淹没其中得不到利用。

智能化的数据处理技术对这些文档材料进行自动分类、归档、提取出有用信息,最终帮助企业降低人力成本、提高经济效益。

陈运文认为,如何让计算机智能地处理文本数据,是一件非常重要的事情。“我们做的事情是对文本数据进行挖掘处理,使之以结构化的方式呈现出来,提升人们的工作效率。”

如今,达观数据的技术可以帮助律师处理大量的文本资料;帮助金融机构建立智能客服以及理财产品推荐系统;帮助企业通过文档语义提取、资料精准推荐建立行业知识图谱;在传媒行业自动打标签、审核过滤、建立个性化推荐;在电商行业建立客户画像建模等一系列应用。

2.jpg

达观数据的一台服务器能够代替15个工作人员处理各种与文字相关的企业数据,大大提高了企业效率,辅助人们完成各种繁重而重复的文本工作,大大降低出错率。

“我想让我们的技术帮到每一个与文字打交道的人,让他们从重复性的文字工作中解脱出来,有更多的时间去创造新的可能性。”正如陈运文给公司起的名字一样,对于人工智能的未来,他的态度是通达、乐观。


本文链接:https://www.woshiqian.com/post/2908.html

百度分享获取地址:https://share.baidu.com/code

我是钱微信/QQ:5087088

广告位、广告合作QQ:5087088

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

       

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。